Kontrolovatelnost rozhodování AI

Klasické programy fungují předvídatelně a když dojde k chybě, lze ji znovu vyvolat a prozkoumat.

Při opakovaném průběhu totiž nastane znovu, se stejným výsledkem i stejným záznamem do logů a je tak možné dohledat příčinu a najít řešení.

AI Chatboti se nechovají deterministicky, na stejné otázky mohou podávat různé odpovědi pro každý jednotlivý průběh. Typickým příkladem je halucinovaná odpověď, která ovšem nekončí chybovým stavem, protože z pohledu chatbota se jedná o správně vykonanou úlohu.

Agentní systémy celou situaci významně komplikují. Agenti, kteří samostatně používají SW nástroje, zadávají částečné úkoly jiným agentům a jsou schopni provádět vícekroková rozhodování, násobně rozšiřují oblasti případného hledání chyby. Pro zopakování chyby je tak potřeba zrekonstruovat celý řetězec událostí, použité utility a zdroje dat, a to vše včetně zachování verzí různých modelů.

Tradiční SW:

Příčinou chyby je obvykle špatný kód, HW chyba v infrastruktuře, špatná konfigurace nebo chyba uživatele.
Chyba je konzistentní, opakovatelná
Reprodukce je snadná, a to opakovaně se stejným výsledkem.
Zdrojů k prozkoumání bývá dostatek – aplikační, síťové a systémové logy.

LLM:

Co může být příčinou chyby: model, trénovací data, prompt, zřetězení vyhledávání, omezení MCP (Model Context Protocol) nebo různé jejich kombinace.
Halucinace není chyba, stav je OK
Obtížně reprodukovatelné – na stejnou otázku může pokaždé podat jinou odpověď, míra úspěšnosti zopakování závisí na kontrole nad verzí modelu, nastavení temperature, kompletní prompt a vyhledávací kontext
Degradace nebo postupné odchýlení modelu je obtížně detekovatelné, dokud nedojde k závažné chybě
Zdroje k prozkoumání – je potřeba ukládat velké množství informací jako logy vyhledávání a dovozování, prompt, kontext, dedukce agentů (většina těchto informací se defaultně neukládá).

Co zachovat pro možnost případné rekonstrukce chybového chování AI:

Spárované dotazy a odpovědi, včetně časové posloupnosti
Kompletní systémový prompt, uživatelský vstup, další automatizované kroky. Komplexní systémy jsou schopné dynamicky vytvářet prompt z kombinace šablon, uživatelských dotazů a obsahu dokumentů (RAG – Retrieval-augmented Generation).
Logy RAG systémů: odkazy na konkrétní dokumenty nebo jejich části, dotaz a skóre, které vedlo k jejich výběru. Všechny tyto záznamy by měly být uloženy společně s generovanou odpovědí.
Záznamy o verzích modelů, použitých pro získání dat. Bez této informace nemusí být možné rozhodnout, zda chyba nastala kvůli špatnému zadání dotazu nebo změnou modelu pro získávání dat.
Záznamy akcí agentů – jaké použili nástroje a proč, jak delegovali úkoly a komu, jak úkoly řadili za sebe.
Detailní informace o modelu – verze, ladění, konfigurace, nastavení mantinelů.

Kontrolovatelnost rozhodování AI

DÁlE BY VÁS MOHLO ZAJÍMAT

Kontrolovatelnost rozhodování AI

Bezpečnost v éře IoT

Řízení dodavatelského řetězce