Badacze opracowali modularny system oparty na LLM, który potrafi rozpoznawać i kwantyfikować wartości moralne w tekstach bez ograniczeń teorii.

Źródło zdjęcia: arXiv.org
Zespół badawczy z Uniwersytetu Politechnicznego w Madrycie opracował nową architekturę opartą na dużych modelach językowych (LLM), która potrafi automatycznie identyfikować i kwantyfikować ludzkie wartości w tekście. Badanie zostało opublikowane w materiałach konferencji ICAART 2026 i stanowi odpowiedź na rosnące potrzeby tworzenia systemów AI zdolnych do podejmowania decyzji uwzględniających aspekty etyczne i moralne.
Opracowana przez Eduardo de la Cruz Fernándeza, Marcelo Karanika i Sascha Ossowskiego architektura wprowadza nowatorskie rozwiązanie problemu identyfikacji wartości w tekście. System składa się z trzech współpracujących modułów, które działają w skoordynowany sposób.
Pierwszy moduł generuje ustrukturyzowane specyfikacje wartości bezpośrednio z fundamentalnych tekstów dowolnego frameworka teoretycznego. Drugi moduł wykorzystuje te specyfikacje do etykietowania tekstów, podczas gdy trzeci przypisuje stopniowane wsparcie lub sprzeciw w oparciu o analizę dowodów retorycznych i semantycznych.
Kluczową zaletą nowej architektury jest unikanie ograniczeń poprzednich podejść, które były zazwyczaj powiązane z konkretną teorią wartości lub wymagały skomplikowanego inżynierii promptów. Modularny charakter systemu tworzy skalowalne i reprodukowalne procesy napędzane specyfikacjami wartości, które można adaptować do różnych teorii.
Rozwiązanie zostało przetestowane z wykorzystaniem wielu dużych modeli językowych na zbiorze danych ValueEval. Eksperymenty potwierdziły dobrą wydajność detekcji oraz uniwersalność całego pipeline'u, co czyni go użytecznym narzędziem dla różnych zastosowań.
Wraz z rosnącą autonomią systemów inteligentnych, społeczność naukowa skupia się na tworzeniu mechanizmów podejmowania decyzji, które uwzględniają względy etyczne i moralne, wykraczając poza tradycyjne modele maksymalizacji użyteczności. Ocena zgodności podejmowanych decyzji z ludzkimi wartościami staje się kluczowym aspektem rozwoju odpowiedzialnej sztucznej inteligencji.
Opracowana architektura stanowi obiecujący krok w kierunku automatyzacji tego procesu, oferując narzędzie zdolne do rozpoznawania zarówno jawnych, jak i ukrytych wartości ludzkich w tekstach. To może mieć szerokie zastosowanie w systemach AI wymagających uwzględnienia aspektów etycznych w procesie decyzyjnym.

Framework Query Retrieve Conclude pozwala AI interpretować współczesne memy poprzez wyszukiwanie aktualnej wiedzy w sieci, przewyższając tradycyjne metody.
Alibaba udostępniła open source narzędzie do automatycznego przeglądu kodu z AI. Po dwóch latach użycia wewnętrznego zidentyfikowało miliony błędów.

Meta uruchamia nowego asystenta AI dla twórców, który oferuje spersonalizowane rekomendacje i pomoc w analizie wydajności treści na Facebooku.