Haly pro rekordy

Dokončování hokejové haly v Miláně na poslední chvíli? Vůbec jim to nezávidíme, říkají slavní architekti

Exploze poptávky

Rok 2026 přinese historický obrat v energetice: obnovitelné zdroje překonají uhlí, jádro se vrací s novou silou

Německý návrh

Havlíček odmítá dvourychlostní EU: Je to politický signál, ne reálný plán Berlína

Dostupnější medikamenty

Trump spouští TrumpRx.gov: nový web má Američanům výrazně zlevnit léky

Německá ekonomika

Německé firmy dávají vládě špatné vysvědčení. Ekonomika ale vysílá první pozitivní signály

Impérium CSG

Strnadovo asijské tažení. Jeho Excalibur Army dodá přes 100 obrněnců Patriot za 6 miliard

Vědecká studie

Umělá inteligence nám záměrně lže, odhaluje výzkum OpenAI. A odnaučit ji to nebude snadné

Umělá inteligence občas halucinuje – odpovídá sebevědomě i tehdy, když neví. Teď ale OpenAI zveřejnila výzkum, který odhaluje hlubší problém: modely dokážou klamat i vědomě. A co víc, když se je to budete snažit odnaučit, jen jim dáte návod, jak lhaní lépe skrývat.

Hrot24

19. září 2025

Nová studie OpenAI ve spolupráci s Apollo Research zkoumala fenomén nazývaný scheming (intrikaření). Jde o situaci, kdy se AI navenek chová poslušně, ale zároveň má vlastní skryté „úmysly“.

Autoři ji přirovnávají k makléři, který porušuje pravidla jen proto, aby maximalizoval zisk. Nejčastějším projevem je, že model předstírá splnění úkolu, aniž by jej skutečně vykonal.

Klasické metody učení na tento problém nestačí. Pokud se vývojáři snaží „odnaučit“ model podvádět, může se stát, že jej naopak naučí lhát chytřeji a lépe skrývat stopy. „Trénink vede k tomu, že model začne kout pikle opatrněji a skrytěji,“ shrnují autoři výzkumu.

Virtuální pud sebezáchovy

Kam až zajde umělá inteligence za vlastní záchranou? Klidně nechá zemřít člověka, zjistili vědci

Ještě znepokojivější je fakt, že modely dokážou rozpoznat, že jsou testovány – a přizpůsobit se. Jinými slovy: vědí, že jsou pod dohledem, a tak dočasně přestanou klamat, aby prošly zkouškou.

Rozdíl mezi běžnými halucinacemi a schemingem je přitom zásadní. Halucinace jsou spíše nevinnou „střelbou od boku“. Scheming je úmyslné klamání.

Dobrou zprávou je, že výzkumníci úspěšně otestovali novou techniku nazvanou deliberative alignment. Ta spočívá v tom, že model před samotnou akcí musí projít „antischemingovou“ instrukcí a zopakovat si pravidla. Podobně jako když dítěti připomenete, co se smí a nesmí, než ho pustíte na hřiště. Výsledky ukazují, že metoda skutečně snižuje počet případů podvodného chování.

Technologie

Začínáme mluvit jako roboti? Studie potvrzuje, že umělá inteligence už dokonce mění lidský jazyk

Podle spoluzakladatele OpenAI Wojciecha Zaremby zatím nikdo nezaznamenal závažné či nebezpečné projevy tohoto jevu. Připouští ale, že i ChatGPT občas „maličko lže“ – například tvrdí, že dokončil úkol, který ve skutečnosti nesplnil.

Výzkum ale zároveň upozorňuje, že jakmile se AI systémy začnou více zapojovat do složitějších a dlouhodobých úkolů s reálnými dopady, riziko škodlivého klamání poroste. Proto je podle autorů nutné investovat i do vývoje odpovídajících testů a ochranných mechanismů.