Podle zakladatele Wikipedie procházejí AI boti systematicky celý obsah databáze, což výrazně zatěžuje její technickou infrastrukturu
Foto: Shutterstock.com
Obsahové licence
Wikipedia jedná s technologickými giganty, chce zpeněžit svůj obsah
Provozovatel internetové encyklopedie Wikipedia jedná s velkými technologickými firmami o uzavření dohod podobných té, kterou má s Googlem. Snaží se tak zpeněžit rostoucí závislost firem zabývajících se umělou inteligencí na svém obsahu.
čtk
Agentuře Reuters to řekl spoluzakladatel Wikipedie Jimmy Wales. Firmy podle něj využívají volně dostupná data z Wikipedie k trénování jazykových modelů, což zvyšuje náklady, které musí nezisková organizace provozující Wikipedii sama nést.
Wales upozornil, že automatické programy využívané k trénování AI, tzv. AI boti, systematicky procházejí celý obsah Wikipedie. To výrazně zatěžuje její technickou infrastrukturu, protože je potřeba více serverů, paměti i kapacity pro ukládání dat. Podle něj tak Wikipedii vznikají neúměrně vysoké náklady, které musí jako nezisková organizace financovat sama.
Pro jednotlivce zůstává obsah Wikipedie podle licence zdarma. Automatizovaný přístup velkého objemu dat od komerčních subjektů je ale jiná věc, uvedl Wales. Připomněl, že se už podařilo podepsat smlouvu s firmou Google ze skupiny Alphabet a že pokračují jednání s dalšími společnostmi.
Nadace Wikimedia, která provozuje Wikipedii už více než 20 let, uzavřela v roce 2022 dohodu s Googlem. Ten jí začal platit za přístup k obsahu Wikipedie využívanému k trénování AI. Data Wikipedie jsou ale důležitá i pro další firmy, jako je OpenAI nebo Meta Platforms, které na nich stavějí své vlastní modely.
Hlavním zdrojem příjmů nadace jsou malé dary od veřejnosti, nadace spoléhá i na globální komunitu dobrovolných editorů. Wales ale upozornil, že dary od veřejnosti by neměly být určeny k financování vývoje komerčních produktů AI v hodnotě miliard dolarů. "Wikipedii podporují dobrovolníci. Tito lidé darují peníze na podporu Wikipedie, a ne na dotování OpenAI, které nás stojí spoustu peněz. Přijde mi to nespravedlivé," řekl Wales.
Snaha Wikipedie získat více licencí staví největší světové úložiště volně dostupných znalostí do možné konfrontace s rychle rostoucím odvětvím AI. Přináší tak zásadní otázky: kdo by měl nést náklady na obrovské datové soubory, které pohánějí rozvoj AI, a zda by komerční firmy neměly mít povinnost finančně kompenzovat veřejné a neziskové zdroje, které jim pomáhají vytvářet jejich technologie.
Na otázku, zda by Wikipedia mohla podniknout právní kroky proti firmám využívajícím její obsah k trénování AI bez placení, Wales připustil, že si není jist. Podle něj může být účinnější spoléhat se na tzv. měkkou sílu Wikipedie, tedy na veřejnou kritiku a společenský tlak, který firmy donutí změnit chování, než se pouštět do soudních sporů. Wikipedia by také mohla zvážit technická opatření, která by omezila přístup AI botů k jejímu obsahu. Wales ale přiznal, že by to mohlo být v rozporu s principem volného přístupu k informacím. Zdůraznil ale, že rostoucí finanční zátěž je nutné řešit.
Wikipedia se navzdory svému úspěchu neustále potýká s udržením neutrálního pohledu, zejména u kontroverzních politických a společenských témat. Wales poznamenal, že drtivá většina editorů nejsou aktivisté, ale při velkých globálních konfliktech je těžké zachovat klidnou neutralitu. Přesto podle něj komunita zvládá tuto úlohu velmi dobře i v náročných situacích.