Vini Brasil wyjaśnia, dlaczego często odrzuca działający kod AI. Problem leży w przeglądzie zmian i braku zrozumienia implementacji przez programistę.

Źródło zdjęcia: Vinicius Brasil
Doświadczony programista Vini Brasil dzieli się swoimi przemyśleniami na temat pracy z narzędziami AI do generowania kodu. W swoim artykule wyjaśnia, dlaczego często odrzuca kod stworzony przez sztuczną inteligencję, nawet gdy działa poprawnie i przechodzi testy.
Autor zauważa, że wraz z coraz szybszą implementacją kod generowany przez AI, prawdziwym wyzwaniem staje się przegląd ogromnej ilości tworzonego kodu. Problem dotyczy nie tylko kodu współpracowników, ale również własnych zmian po zakończeniu pracy przez agenta kodującego.
Przed wprowadzeniem agentów kodujących proces rozwiązywania problemów wyglądał zupełnie inaczej. Programista eksplorował bazę kodu, rozważał różne rozwiązania, eksperymentował i dopiero wtedy implementował. Mogło to zająć dni na zebranie kontekstu, ale finalny pull request charakteryzował się większą pewnością autora i łatwością wyjaśnienia zmian współpracownikom.
Brasil przyznaje, że realizacja dużych zadań z pomocą AI nadal zajmuje mu dni. Często odrzuca wszystkie zmiany wprowadzone przez sztuczną inteligencję i zaczyna od początku. Różnica między pierwszą a drugą sesją nie tkwi w modelu językowym, ale w programiście przed ekranem. Więcej czasu na zrozumienie problemu pozwala kierować agentem w stronę lepszego rozwiązania, zamiast być przez niego prowadzonym.
Autor wymienia konkretne powody, dla których odrzuca kod generowany przez sztuczną inteligencję:
Brasil podkreśla problem zbyt szybkiej akceptacji zmian generowanych przez AI przez innych inżynierów. Dlatego opowiada się za obowiązkową ludzką weryfikacją w połączeniu z przeglądami AI. Kod, który działa i przechodzi testy CI, może nadal być złym rozwiązaniem. Inżynieria zawsze polegała na implementacji odpowiednich, skalowalnych i rozszerzalnych rozwiązań.
Mimo że agenty kodujące są imponujące i mogą pomóc w zadaniach wykraczających poza samo pisanie kodu, nadal nie są w stanie działać autonomicznie w sposób zrównoważony. Wymagają doświadczonego inżyniera, który poprowadzi je do doskonałych rozwiązań.

Badanie AllenAI ujawnia, że modele hybrydowe przewyższają transformery przy słowach znaczących, ale przegrywają przy powtórzeniach i zamykających nawiasach.

Badacze opracowali system łączący planery oparte na regułach z modelami neuronowymi, znacząco poprawiając dokładność przewidywania trajektorii.

Trump nakazał Anthropic wyłączenie modeli Fable 5 i Mythos 5 po doniesieniach o lukach w zabezpieczeniach. Eksperci krytykują decyzję jako niebezpieczną.