Краят на "безплатния обяд": AI гигант плаща $1.5 млрд. за обучение с "крадени" книги
В повратен момент за технологичната индустрия, компанията за изкуствен интелект Anthropic се съгласи да плати над 1.5 милиарда долара по извънсъдебно споразумение, слагайки край на мащабен съдебен иск за нарушаване на авторски права. Според публикация в The New York Times, която първа съобщи за новината, споразумението признава, че AI моделът на компанията, Claude, е бил обучаван с хиляди книги и статии без разрешението или заплащането на техните автори. Този прецедент слага край на ерата на "безплатния обяд" и заплашва да преобърне из основи икономиката зад целия сектор на генеративния AI.
Ябълката на раздора: "Първородният грях" на AI
В основата на проблема лежи самият начин, по който се създават големите езикови модели (LLM) като Claude, ChatGPT и Gemini. За да се "научат" да разбират езика, да разсъждават и да творят, те трябва да "прочетат" невъобразимо количество текст и изображения. В продължение на години AI компаниите оперираха под негласното правило, че всичко, което е публично достъпно в интернет, е позволено за използване като тренировъчни данни.
Този подход, определян от критиците като "първородния грях" на AI, позволи на няколко компании да изградят продукти на стойност стотици милиарди долари, стъпвайки върху интелектуалния труд на милиони писатели, журналисти, художници и програмисти, без да им платят и стотинка.
Прецедентът: Защо това споразумение променя всичко
Съдебният иск срещу Anthropic беше заведен от коалиция, включваща Гилдията на авторите и няколко от най-големите издателски къщи. За разлика от предишни дела, които завършваха с малки глоби, този път сумата е огромна и най-важното – тя не е глоба, а споразумение. Това е мълчаливо признание, че данните имат цена.
"Това е денят, в който данните официално получиха цена", коментира анализатор пред технологичното издание The Verge. "Досега разходите за AI бяха основно за изчислителна мощ – чипове на NVIDIA и сървъри. Сега всяка AI компания трябва да добави нов, потенциално огромен разход към своя бизнес план: лицензиране на съдържание."
Споразумението задължава Anthropic не само да плати на авторите, чиито произведения са били използвани, но и да въведе прозрачни механизми, чрез които в бъдеще да получава съгласие и да заплаща за данните, с които обучава следващите версии на своите модели.
Ефектът на доминото: Какво следва за OpenAI, Google и Meta?
Сега всички погледи са насочени към конкурентите на Anthropic. Компании като OpenAI (създателите на ChatGPT), Google и Meta са изправени пред десетки подобни съдебни дела и натискът върху тях да последват примера на Anthropic ще бъде огромен.
Този прецедент създава няколко възможни сценария за бъдещето:
- Вълна от споразумения: Най-вероятно ще видим поредица от подобни многомилиардни споразумения между AI компаниите и големите притежатели на съдържание (медийни групи, издателства, фотографски агенции).
- Създаване на пазар за данни: Ще се роди изцяло нов пазар за "AI-ready" данни – огромни, качествени и етично придобити масиви от информация, специално подготвени за обучение на модели.
- "По-малки" и специализирани модели: Високата цена на данните може да направи създаването на гигантски, всеобхватни модели като GPT-4 икономически неизгодно. Вместо това, фокусът може да се измести към по-малки, специализирани AI модели, обучени върху по-малки, но напълно лицензирани масиви от данни.
Бъдеще с цена: Новата ера за изкуствения интелект
Ерата на безразборното "изгребване" на интернет за данни приключи. Споразумението на Anthropic е болезнен, но необходим шамар за индустрия, която дълго време поставяше иновациите над етиката. Макар това да забави темпото на развитие и да го направи значително по-скъпо, то поставя основите на едно по-устойчиво и справедливо бъдеще. Бъдеще, в което изкуственият интелект ще се гради не върху "кражба", а върху партньорство с хората, чийто труд го прави възможен.


Коментари (0)