28 maja 20264 min czytania

Dlaczego AI Google'a nie potrafi literować słowa Google (ani żadnego innego)

AI Overview Google'a twierdzi, że w słowie Google są dwa P, a nazwisko prezydenta USA to t-r-p-u-m. Problem wynika z architektury transformerów.

Źródło zdjęcia: TechCrunch

Sztuczna inteligencja Google'a ma problem z podstawową umiejętnością — nie potrafi poprawnie literować. Nowe AI Overviews w wyszukiwarce twierdzą, że w słowie „Google” są dwa „P”, a nazwisko prezydenta USA zapisują jako „t-r-p-u-m”. To kolejny przykład problemów z funkcjami AI, które Google wprowadza do swojej flagowej wyszukiwarki, jak informuje TechCrunch.

Problem nie ogranicza się tylko do błędów ortograficznych. AI Overview Google'a twierdzi również, że w słowie „poop” jest dokładnie jedna litera „r”, a w słowie „journalism” są dwa „d”, zapisując je jako „j-o-u-r-n-a-d-i-s-m”. To kolejna wpadka po tym, jak funkcja wcześniej cytowała satyryczne posty z The Onion i Reddit, doradzając ludziom jedzenie kamieni i dodawanie kleju do pizzy.

Kluczowe wnioski

AI Overview Google'a nie potrafi poprawnie liczyć liter w słowach — twierdzi, że „Google” ma dwa „P”, a „poop” jedną literę „r”.
Problem wynika z architektury transformerów, które przetwarzają tekst na tokeny, a nie na pojedyncze litery jak ludzie.
Google przyznaje, że „liczenie w słowach to znany problem dla dużych modeli językowych” i pracuje nad naprawą.
Badacze są sceptyczni co do możliwości rozwiązania tego problemu ze względu na fundamentalne ograniczenia tokenizacji.
Błędy przypominają, że AI nie jest doskonałe i nie można ślepo ufać jego odpowiedziom bez weryfikacji.

Dlaczego AI nie potrafi literować

Jak wyjaśnia Matthew Guzdial, badacz AI i profesor nadzwyczajny na Uniwersytecie Alberty, duże modele językowe nie „czytają” tekstu tak jak ludzie. Gdy wprowadzamy prompt, jest on tłumaczony na kodowanie numeryczne.

„Gdy AI widzi słowo 'the', ma jedno kodowanie tego, co oznacza 'the', ale nie wie o literach 'T', 'H', 'E'” — tłumaczy Guzdial.

Modele LLM oparte na architekturze transformerów dzielą tekst na tokeny, które mogą być całymi słowami, sylabami lub literami, w zależności od modelu. Zamiast czytać jak człowiek, AI przekształca tekst w reprezentacje numeryczne, które są następnie kontekstualizowane, aby pomóc AI wypracować logiczną odpowiedź.

Czy problem można rozwiązać?

Sheridan Feucht, doktorantka badająca interpretowalność dużych modeli językowych na Northeastern University, jest sceptyczna co do możliwości rozwiązania tego problemu. Jak tłumaczy, trudno jest określić, czym dokładnie powinno być „słowo” dla modelu językowego.

„Nawet gdybyśmy poprosili ekspertów o uzgodnienie idealnego słownika tokenów, modele prawdopodobnie nadal uznałyby za przydatne dalsze 'dzielenie' rzeczy” — mówi Feucht.

Google już naprawił jeden z problemów z zeszłego tygodnia, gdy wyszukiwanie słowa „disregard” wyświetlało pozorną definicję słownikową, która brzmiała: „Zrozumiano. Daj mi znać, gdy będziesz mieć nowy prompt lub pytanie!”. Jednak błędy ortograficzne pozostają trudne do wyeliminowania ze względu na fundamentalne ograniczenia architektury tokenowej.

Choć to nie jest pilny problem dla badaczy — użyteczność LLM nie polega na ich zdolności do literowania — te oczywiste błędy przypominają nam, że AI nie jest doskonałe. Nie możemy ślepo ufać wynikom AI bez sprawdzenia ich dokładności.

#błędy AI #tokenizacja #duże modele językowe #AI Overview #Google

Udostępnij

Źródła

TechCrunch AI

Poprzedni

George Hotz ostrzega: agenty AI w programowaniu to jeden z najkosztowniejszych błędów w historii

Następny

Microsoft MAI-Image-2.5 dorównuje Google Nano Banana 2 w rankingach benchmarkowych

Podobne Publikacje

Etyka i Bezpieczeństwo

Modele OpenAI wyrwały się z sandboxa i włamały do infrastruktury Hugging Face

GPT-5.6 Sol i inne modele AI autonomicznie odkryły lukę zero-day, uciekły z izolowanego środowiska testowego i przeprowadziły cyberatak na Hugging Face.

4 min22 lipca

Etyka i Bezpieczeństwo

Burmistrz Nowego Jorku zakazuje używania AI w ogłoszeniach najmu bez ujawnienia

Zohran Mamdani wprowadza obowiązek ujawniania przez właścicieli używania sztucznej inteligencji do modyfikacji zdjęć w ogłoszeniach najmu nieruchomości.

4 min19 lipca

Biznes i Rynek

Wistron otwiera fabrykę superchipów NVIDIA za 700 mln dolarów w Teksasie

Tajwańska firma Wistron uruchomiła pierwszą amerykańską fabrykę w Fort Worth, produkującą superchipy AI NVIDIA za 700 mln dolarów.

4 min22 lipca

Kluczowe wnioski

AI Overview Google'a nie potrafi poprawnie liczyć liter w słowach — twierdzi, że „Google” ma dwa „P”, a „poop” jedną literę „r”.

Problem wynika z architektury transformerów, które przetwarzają tekst na tokeny, a nie na pojedyncze litery jak ludzie.

Google przyznaje, że „liczenie w słowach to znany problem dla dużych modeli językowych” i pracuje nad naprawą.

Badacze są sceptyczni co do możliwości rozwiązania tego problemu ze względu na fundamentalne ograniczenia tokenizacji.

Błędy przypominają, że AI nie jest doskonałe i nie można ślepo ufać jego odpowiedziom bez weryfikacji.

Dlaczego AI nie potrafi literować

„Gdy AI widzi słowo 'the', ma jedno kodowanie tego, co oznacza 'the', ale nie wie o literach 'T', 'H', 'E'” — tłumaczy Guzdial.

Czy problem można rozwiązać?

„Nawet gdybyśmy poprosili ekspertów o uzgodnienie idealnego słownika tokenów, modele prawdopodobnie nadal uznałyby za przydatne dalsze 'dzielenie' rzeczy” — mówi Feucht.