Alibaba udostępniła open source narzędzie do automatycznego przeglądu kodu z AI. Po dwóch latach użycia wewnętrznego zidentyfikowało miliony błędów.
Źródło zdjęcia: GitHub
Alibaba udostępniła na GitHub narzędzie Open Code Review — otwarte oprogramowanie do automatycznego przeglądu kodu, wykorzystujące sztuczną inteligencję. Projekt powstał na bazie wewnętrznego narzędzia koncernu, które przez dwa lata służyło dziesiątkom tysięcy programistów i zidentyfikowało miliony błędów w kodzie. Szczegóły dostępne są w repozytorium GitHub.
Open Code Review powstało w odpowiedzi na ograniczenia ogólnych agentów AI w przeglądzie kodu. Zespół Alibaba zidentyfikował trzy kluczowe problemy istniejących rozwiązań, takich jak Claude Code with Skills.
Pierwszym wyzwaniem jest niepełne pokrycie — przy większych zestawach zmian agenty często „idą na skróty”, selektywnie przeglądając tylko niektóre pliki i pomijając inne. Drugim problemem jest dryft pozycji, gdzie zgłaszane problemy często nie pasują do rzeczywistej lokalizacji kodu, z numerami linii lub odwołaniami do plików odbiegającymi od celu. Trzecim to niestabilna jakość — umiejętności sterowane językiem naturalnym są trudne do debugowania, a jakość przeglądu znacząco waha się przy drobnych zmianach w promptach.
Główną przyczyną tych problemów jest architektura oparta wyłącznie na języku, która nie ma twardych ograniczeń procesu przeglądu.
Filozofia Open Code Review polega na łączeniu deterministycznego inżynierstwa z agentem, gdzie każdy element zajmuje się tym, co robi najlepiej.
Deterministyczna inżynieria zapewnia twarde ograniczenia dla kroków przeglądu, które nie mogą pójść źle. Logika inżynierska, a nie model językowy, gwarantuje poprawność w kluczowych obszarach: precyzyjnym wybieraniu plików do przeglądu, inteligentnym grupowaniu powiązanych plików w pojedyncze jednostki recenzji oraz szczegółowym dopasowywaniu reguł do charakterystyki każdego pliku.
Agent koncentruje swoje mocne strony na dynamicznych decyzjach i dynamicznym pobieraniu kontekstu. Wykorzystuje prompty głęboko zoptymalizowane pod kątem przeglądu kodu, poprawiając skuteczność przy jednoczesnym zmniejszeniu zużycia tokenów. Zestaw narzędzi został wyodrębniony z głębokiej analizy śladów wywołań narzędzi w danych produkcyjnych na dużą skalę.
Narzędzie można zainstalować na kilka sposobów. Najłatwiejszym jest instalacja przez npm: npm install -g @alibaba-group/open-code-review. Po instalacji komenda ocr staje się dostępna globalnie.
Alternatywnie można pobrać najnowsze binarium z GitHub Releases dla różnych platform — macOS (Apple Silicon i Intel), Linux (x86_64 i ARM64) oraz Windows. Dostępna jest też opcja kompilacji ze źródeł.
Przed rozpoczęciem pracy należy skonfigurować model językowy. Narzędzie obsługuje różne dostawców, w tym Anthropic Claude. Konfigurację można ustawić interaktywnie lub przez zmienne środowiskowe. Po konfiguracji można przetestować połączenie komendą ocr llm test.
Do przeglądu kodu służą trzy główne tryby: workspace mode dla wszystkich zmian staged, unstaged i untracked, porównanie zakresów gałęzi oraz przegląd pojedynczego commitu. Narzędzie oferuje również integrację z agentami kodującymi i może być używane jako usługa sieciowa.
Projekt ma na celu rozwiązanie problemów z jakością i niezawodnością automatycznego przeglądu kodu, łącząc sprawdzone metody inżynierskie z możliwościami sztucznej inteligencji w stabilnym i przewidywalnym rozwiązaniu.

Nowe rozporządzenie Trumpa tworzy dobrowolne ramy dla firm AI do przekazywania modeli na testy bezpieczeństwa. Google, Microsoft i xAI już się zgodziły.

Prezydent potwierdził rozmowy z firmami AI o partnerstwie, które miałoby przynieść korzyści obywatelom USA. CNBC donosi o konkretnych dyskusjach z OpenAI.
Bezpardonowa analiza stanu przemysłu AI — dlaczego chińskie modele jak Qwen 3.7 Max wypierają amerykańskich gigantów i jak firmy tracą miliony na AI.