České weby se AI botům nebrání. Můžeme tím získat konkurenční výhodu
Shutterstock.com
Hrotagon
České weby se AI botům nebrání. Můžeme tím získat konkurenční výhodu
Boti ale nesledují reklamy. Jsme na počátku změny online marketingu?
Jan Čurn
Umělá inteligence se stala neoddělitelnou součástí digitálního světa. Aby mohla dobře fungovat, potřebuje obrovské množství dat, ať už pro trénink modelů, nebo konkrétní AI aplikace. Pro získání těchto dat jsou potřeba tzv. AI boty, sofistikované programy, které analyzují a zpracovávají informace z webových stránek a poskytují je pak ke zpracování umělé inteligenci. To doceníte například při vyhledávání informací – ať už pomocí Google, ChatGPT či Perplexity – nebo na chatbotu zákaznické podpory, když nebudete vědět, jaké jsou obchodní podmínky. Aby vám jakýkoli AI nástroj poskytl tu nejlepší odpověď, je pro něj zásadní, aby měl přístup k webovým stránkám, ze kterých může tyto informace čerpat.
České weby se botům nebrání
Provozovatelé webů však mají na přístup AI botů často odlišný pohled. Například ve Spojených státech jim blokuje přístup třetina z tisícovky největších webů. V Česku jsme v tomto směru poněkud otevřenější. Jak ukázala naše analýza, přistupovat AI botům ke svým datům tu brání pouhých 5,1 % webů. Nabízí se proto otázka: Proč jsou domácí weby botům výrazně otevřenější?
Mezi oněmi pěti procenty najdete především zpravodajské weby a pracovní portály. Patří mezi ně například mediální domy iDnes, Nova či Deník, stejně jako portály Práce.cz nebo Jobs.cz. Jejich motivace je pochopitelná – jednoduše chrání svůj obsah před komerčním využitím třetími stranami. Jenže blokování může být dvousečná zbraň. Pokud média blokují přístup AI botům, může se stát, že umělá inteligence bude čerpat z méně spolehlivých zdrojů, jakými jsou například pochybná diskuzní fóra. A to může vést k problémům, pokud se na těchto datech budou zakládat důležitá rozhodnutí.
Mají-li budoucí AI systémy umět dobře česky a znát lokální kontext, potřebují získat přístup k velkému množství českého obsahu. Umělá inteligence už dnes dramaticky mění způsob, jakým pracujeme. Například u nás v Apify používáme AI agenty na denní bází napříč celou firmou – na zákaznické podpoře, v sales oddělení, pro vývoj softwaru, ale také v našich samotných produktech, tzv. webových Aktorech. Celkově se ve svém okolí setkáváme s řadou dalších nejen vývojářských společností, které AI používají k odbavování rutinních úkolů a jdou tomu naproti.
Konkurenční výhoda
Blokování AI botů může webům paradoxně přinést i obchodní výhody. S tím, jak roste význam AI vyhledávačů a asistentů, riskují tyto weby, že budou méně viditelné pro nové návštěvníky. Na druhou stranu je třeba připustit, že okolo využívání webového obsahu pro trénink AI modelů panuje stále mnoho nevyřešených právních otázek. Dobrým příkladem je spor z prosince roku 2023, kdy New York Times žalovaly Microsoft a OpenAI z porušování autorských práv a zneužívání duševního vlastnictví. Zároveň však letos New York Times podepsaly licenční dohodu s Amazonem, která umožňuje používat jejich redakční obsah k trénování modelů umělé inteligence.
Česká otevřenost vůči AI botům tedy může být potenciální konkurenční výhoda. Pokud dokážeme najít rovnováhu mezi ochranou obsahu a jeho sdílením pro využití umělou inteligencí, můžeme si být jisti, že budoucí generace AI nám bude lépe rozumnět – jak jazyku, tak i kultuře. Možná tedy nižší míra blokování není známkou nedbalosti, ale spíše prozíravého přístupu k technologické budoucnosti naší země.
Boti nesledují reklamy
Pokud čím dál více webového obsahu budou konzumovat AI boti místo lidí, stává se palčivější otázka: Kdo bude za tvorbu a poskytování webového obsahu platit? Tradiční obchodní model webu byl založený na tom, že když vytváříte veřejný obsah, tak vám Google nebo jiné vyhledávače posílají lidské návštěvníky, které pak můžete monetizovat, třeba reklamou. Např. Google před deseti lety posílal webům na každé 2 stažení jedné stránky zhruba jednoho návštěvníka. Nyní je tento poměr u Google už 6 : 1. V případě OpenAI 250 : 1 a u Antrophicu dokonce 6 000 : 1 (zdroj). Tedy zatímco náklady na poskytování obsahu vydavatelům rostou, výnos z něj klesá, což není dlouhodobě udržitelné.
Nejlogičtější řešení by bylo, aby boti za konzumaci obsahu platili vydavatelům „mikroplatby“, a tím zajistili, aby vydavatelé měli příjmy a mohli dále vytvářet svůj obsah. A skutečně, poslední dobou vzniklo několik nových startupů, např. Skyfire nebo Tollbit, které spolupracují s platformami na distribuci obsahu a blokování botů, které tuto věc již nyní umožňují. Dokonce i Cloudflare, jeden z největších content delivery networks (CDN), o této věci hovoří jako o nutnosti.
I my v Apify věříme, že toto je do budoucna jediná správná a férová cesta, jak udržet web funkční a otevřený.
Autor je zakladatel Apify
Máte co říci? Pošlete nám svůj komentář na komentare@hrotmedia.cz