Źródło zdjęcia: huggingface.co
Firma HCompany przedstawiła HoloTab — rozszerzenie do przeglądarki Chrome, które wykorzystuje sztuczną inteligencję do automatyzacji zadań w internecie. Nowe narzędzie opiera się na modelu Holo3, wydanym przez zespół 31 marca tego roku, i ma na celu udostępnienie zaawansowanych możliwości AI wszystkim użytkownikom bez konieczności posiadania wiedzy technicznej.
HoloTab działa jak wirtualny asystent, który nawiguje po stronach internetowych w taki sam sposób, jak robiłby to człowiek. Użytkownicy wystarczy opisać zadanie, a agent przejmuje kontrolę nad przeglądarką — wypełnia formularze, klika odpowiednie elementy i podejmuje decyzje zgodnie z instrukcjami.
„Opisujesz, czego chcesz, a agent zajmuje się tym bezpośrednio w twojej przeglądarce, nawigując po interfejsach, wypełniając pola i podejmując decyzje tak samo, jak ty byś to robił" — wyjaśnia zespół HCompany. W tle pracują modele wizyjne, planowanie działań i rozumienie interfejsów, ale użytkownik widzi jedynie końcowy rezultat.
Kluczową innowacją HoloTab jest system o nazwie "Routines", który pozwala na nagrywanie i automatyzację powtarzalnych zadań. Gdy użytkownik rozpocznie nagrywanie, rozszerzenie obserwuje jego działania w przeglądarce w czasie rzeczywistym, rejestrując kliknięcia i opcjonalnie komentarze głosowe wyjaśniające poszczególne kroki.
System ten ma rozwiązać problem żmudnych, powtarzalnych czynności — jak przykładowe porównywanie cen konkurencji na dwudziestu różnych stronach e-commerce w celu aktualizacji arkusza kalkulacyjnego, czy przeszukiwanie kilkunastu portali z ofertami pracy i przenoszenie szczegółów do dokumentu śledzącego aplikacje.
Po zakończeniu nagrywania generowana jest rutyna, którą można uruchamiać wielokrotnie lub zaplanować na określone momenty. HoloTab będzie wtedy samodzielnie powtarzał zarejestrowaną sekwencję działań.
Zespół HCompany podkreśla demokratyzujący aspekt swojego rozwiązania. „AI do obsługi komputera zmieni sposób, w jaki ludzie pracują, prowadzą badania i załatwiają sprawy, zarówno w życiu zawodowym, jak i prywatnym, a ta zmiana jest już bliższa, niż większość ludzi sobie uświadamia" — twierdzi firma.
Kluczowym założeniem jest eliminacja barier technicznych: „Nie powinno się wymagać wykształcenia technicznego, aby uzyskać dostęp, a korzyści nie powinny przypadać tylko zespołom z inżynierami, którzy wiedzą, jak połączyć te systemy ze sobą".

AI Mode w Chrome pozwala otwierać strony obok wyników wyszukiwania i włączać treści z kart do zapytań. Dostępne już w USA, wkrótce globalnie.

Google udostępnił nową funkcję AI Mode, która pozwala otwierać strony internetowe obok konwersacyjnego wyszukiwania AI w przeglądarce Chrome.
HoloTab jest dostępne bezpłatnie w Chrome Web Store i nie wymaga żadnej konfiguracji technicznej. Rozszerzenie opiera się na modelu Holo3, który firma opisuje jako „jeden z najpotężniejszych AI do obsługi komputera na świecie".
Premiera HoloTab wpisuje się w rosnący trend udostępniania zaawansowanych możliwości sztucznej inteligencji użytkownikom końcowym poprzez intuicyjne interfejsy. Firma HCompany wcześniej wypuściła również model Holotron-12B, który również koncentruje się na automatyzacji obsługi komputera z wysoką przepustowością.
Rozszerzenie reprezentuje ewolucję od złożonych systemów wymagających wiedzy programistycznej w kierunku rozwiązań plug-and-play, które mogą natychmiast zwiększyć produktywność każdego użytkownika internetu.