AI Overview Google'a twierdzi, że w słowie Google są dwa P, a nazwisko prezydenta USA to t-r-p-u-m. Problem wynika z architektury transformerów.

Źródło zdjęcia: TechCrunch
Sztuczna inteligencja Google'a ma problem z podstawową umiejętnością — nie potrafi poprawnie literować. Nowe AI Overviews w wyszukiwarce twierdzą, że w słowie „Google” są dwa „P”, a nazwisko prezydenta USA zapisują jako „t-r-p-u-m”. To kolejny przykład problemów z funkcjami AI, które Google wprowadza do swojej flagowej wyszukiwarki, jak informuje TechCrunch.
Problem nie ogranicza się tylko do błędów ortograficznych. AI Overview Google'a twierdzi również, że w słowie „poop” jest dokładnie jedna litera „r”, a w słowie „journalism” są dwa „d”, zapisując je jako „j-o-u-r-n-a-d-i-s-m”. To kolejna wpadka po tym, jak funkcja wcześniej cytowała satyryczne posty z The Onion i Reddit, doradzając ludziom jedzenie kamieni i dodawanie kleju do pizzy.
Jak wyjaśnia Matthew Guzdial, badacz AI i profesor nadzwyczajny na Uniwersytecie Alberty, duże modele językowe nie „czytają” tekstu tak jak ludzie. Gdy wprowadzamy prompt, jest on tłumaczony na kodowanie numeryczne.
„Gdy AI widzi słowo 'the', ma jedno kodowanie tego, co oznacza 'the', ale nie wie o literach 'T', 'H', 'E'” — tłumaczy Guzdial.
Modele LLM oparte na architekturze transformerów dzielą tekst na tokeny, które mogą być całymi słowami, sylabami lub literami, w zależności od modelu. Zamiast czytać jak człowiek, AI przekształca tekst w reprezentacje numeryczne, które są następnie kontekstualizowane, aby pomóc AI wypracować logiczną odpowiedź.
Sheridan Feucht, doktorantka badająca interpretowalność dużych modeli językowych na Northeastern University, jest sceptyczna co do możliwości rozwiązania tego problemu. Jak tłumaczy, trudno jest określić, czym dokładnie powinno być „słowo” dla modelu językowego.
„Nawet gdybyśmy poprosili ekspertów o uzgodnienie idealnego słownika tokenów, modele prawdopodobnie nadal uznałyby za przydatne dalsze 'dzielenie' rzeczy” — mówi Feucht.
Google już naprawił jeden z problemów z zeszłego tygodnia, gdy wyszukiwanie słowa „disregard” wyświetlało pozorną definicję słownikową, która brzmiała: „Zrozumiano. Daj mi znać, gdy będziesz mieć nowy prompt lub pytanie!”. Jednak błędy ortograficzne pozostają trudne do wyeliminowania ze względu na fundamentalne ograniczenia architektury tokenowej.
Choć to nie jest pilny problem dla badaczy — użyteczność LLM nie polega na ich zdolności do literowania — te oczywiste błędy przypominają nam, że AI nie jest doskonałe. Nie możemy ślepo ufać wynikom AI bez sprawdzenia ich dokładności.

Badania psycholożki Gloria Mark pokazują dramatyczny spadek zdolności koncentracji z 2,5 minuty do 47 sekund. Chatboty AI mogą ten proces przyspieszyć.

Badanie z arXiv przedstawia koncepcję warstwy weryfikacyjnej, która ocenia praktyczną niezawodność rozwiązań optymalizacyjnych pod wpływem perturbacji.

Konkurs Piórko 2026 wyznacza standardy dla branży kreatywnej, wprowadzając osobną kategorię dla twórców korzystających z AI. Przełomowa decyzja z jasnymi zasadami transparentności.