Výzkumníci našli neobvyklý způsob, jak testovat schopnosti moderních AI agentů. Nechali je hrát legendární fantasy hru Dungeons & Dragons
Vygenerováno v Nano Banana Pro
Claude, GPT i DeepSeek u jednoho stolu. Chatboti se učí hrát Dračí doupě
Výzkumníci z University of California San Diego našli neobvyklý způsob, jak testovat schopnosti moderních AI agentů. Nechali je hrát legendární fantasy hru Dungeons & Dragons. Ukázalo se, že komplexní příběhy, týmová spolupráce i taktické souboje dokážou odhalit, jak si umělá inteligence poradí s dlouhodobým rozhodováním.
BAC
Jak otestovat AI agenty – softwarové systémy řízené generativní umělou inteligencí – aby dokázali fungovat samostatně po dlouhou dobu? Vědci přišli s netradiční odpovědí: nechají je hrát stolní fantasy hru Dungeons & Dragons, známou například ze seriálového trháku Stranger Things.
Právě tato legendární hra na hrdiny nabízí ideální prostředí pro testování umělé inteligence. Obsahuje složitá pravidla, dlouhé příběhy a vyžaduje koordinaci více hráčů. To z ní dělá vhodný model pro simulaci komplexního rozhodování.
Na tento přístup upozornila také studie výzkumníků z University of California San Diego.
AI jako hráči i vypravěči
Tým vedený vědcem Prithvirajem Ammanabroluem testoval několik pokročilých jazykových modelů. V experimentu umělá inteligence vystupovala v různých rolích – jako hráči, monstra i takzvaný „Dungeon Master“, tedy vypravěč hry.
Celý experiment probíhal v celkem 27 scénářích inspirovaných klasickými bitvami z Dungeons & Dragons. AI agenti spolu soupeřili v takticky náročných soubojích a zároveň spolupracovali s více než dvěma tisíci lidskými hráči.
Podle studie publikované na platformě OpenReview dokázaly některé modely vykazovat překvapivě komplexní strategické chování.
Claude porazil GPT
Výsledky ukázaly poměrně jasné pořadí modelů.
Nejlépe si vedl model Claude 3.5 Haiku od Anthropicu, který těsně následoval GPT-4 od OpenAI. Na třetím místě skončil model DeepSeek-V3.
Vědce však překvapilo něco jiného.
AI agenti se během hry začali spontánně chovat podobně jako lidští hráči. Postavy pronášely dramatické hlášky, vytvářely si osobnost a reagovaly na situace v příběhu.
Například skřeti během boje provokovali protivníky větami jako: „Heh – shiny man’s gonna bleed!“
Paladinové naopak pronášeli heroické projevy ve chvíli, kdy čelili útoku nepřátel.
AI začala hrát roli
Podle autorů studie se tak umělá inteligence začala chovat podobně jako lidé, kteří si při hraní role-playing her vytvářejí vlastní styl a charakter postavy.
Pro výzkumníky to byl zajímavý signál, že AI agenti dokážou nejen plnit úkoly, ale také improvizovat v komplexních sociálních situacích.
Experiment ukazuje, že stolní hry mohou být překvapivě účinným nástrojem pro testování dlouhodobého plánování a rozhodování umělé inteligence.
Více o experimentu vysvětluje doprovodné video výzkumného týmu.