Kontrolovatelnost rozhodování AI

Klasické programy fungují předvídatelně a když dojde k chybě, lze ji znovu vyvolat a prozkoumat.

Při opakovaném průběhu totiž nastane znovu, se stejným výsledkem i stejným záznamem do logů a je tak možné dohledat příčinu a najít řešení.

AI Chatboti se nechovají deterministicky, na stejné otázky mohou podávat různé odpovědi pro každý jednotlivý průběh. Typickým příkladem je halucinovaná odpověď, která ovšem nekončí chybovým stavem, protože z pohledu chatbota se jedná o správně vykonanou úlohu.

Agentní systémy celou situaci významně komplikují. Agenti, kteří samostatně používají SW nástroje, zadávají částečné úkoly jiným agentům a jsou schopni provádět vícekroková rozhodování, násobně rozšiřují oblasti případného hledání chyby. Pro zopakování chyby je tak potřeba zrekonstruovat celý řetězec událostí, použité utility a zdroje dat, a to vše včetně zachování verzí různých modelů.

Tradiční SW:

  • Příčinou chyby je obvykle špatný kód, HW chyba v infrastruktuře, špatná konfigurace nebo chyba uživatele.
  • Chyba je konzistentní, opakovatelná
  • Reprodukce je snadná, a to opakovaně se stejným výsledkem.
  • Zdrojů k prozkoumání bývá dostatek – aplikační, síťové a systémové logy.

LLM:

  • Co může být příčinou chyby: model, trénovací data, prompt, zřetězení vyhledávání, omezení MCP (Model Context Protocol) nebo různé jejich kombinace.
  • Halucinace není chyba, stav je OK
  • Obtížně reprodukovatelné – na stejnou otázku může pokaždé podat jinou odpověď, míra úspěšnosti zopakování závisí na kontrole nad verzí modelu, nastavení temperature, kompletní prompt a vyhledávací kontext
  • Degradace nebo postupné odchýlení modelu je obtížně detekovatelné, dokud nedojde k závažné chybě
  • Zdroje k prozkoumání – je potřeba ukládat velké množství informací jako logy vyhledávání a dovozování, prompt, kontext, dedukce agentů (většina těchto informací se defaultně neukládá).

Co zachovat pro možnost případné rekonstrukce chybového chování AI:

  • Spárované dotazy a odpovědi, včetně časové posloupnosti
  • Kompletní systémový prompt, uživatelský vstup, další automatizované kroky. Komplexní systémy jsou schopné dynamicky vytvářet prompt z kombinace šablon, uživatelských dotazů a obsahu dokumentů (RAG – Retrieval-augmented Generation).
  • Logy RAG systémů: odkazy na konkrétní dokumenty nebo jejich části, dotaz  a skóre, které vedlo k jejich výběru. Všechny tyto záznamy by měly být uloženy společně s generovanou odpovědí.
  • Záznamy o verzích modelů, použitých pro získání dat. Bez této informace nemusí být možné rozhodnout, zda chyba nastala kvůli špatnému zadání dotazu nebo změnou modelu pro získávání dat.
  • Záznamy akcí agentů – jaké použili nástroje a proč, jak delegovali úkoly a komu, jak úkoly řadili za sebe.
  • Detailní informace o modelu – verze, ladění, konfigurace, nastavení mantinelů.
PDF verze