
Meta в центрі скандалу: піратський контент для навчання AI
Нещодавно корпорація Meta опинилася під прицілом звинувачень у використанні неліцензійного контенту для тренування штучного інтелекту.
Про це повідомляє terazus.com.
Судові матеріали розкривають, що замість офіційних баз даних компанія масово завантажувала книги з піратських ресурсів, а внутрішнє листування співробітників демонструє їхню обізнаність щодо сумнівних методів.
Колосальні обсяги піратського контенту
Документи судового розгляду вказують, що Meta отримала 81,7 ТБ нелегальних даних з різних джерел, зокрема:
- 54 ТБ із Z-Library – відомої піратської бібліотеки, яку ФБР частково заблокувало у 2022 році.
- 10 ТБ із LibGen – ще одного нелегального архіву, пов’язаного з російськими серверами.
- 17,7 ТБ із Sci-Hub та інших ресурсів.
Загальний обсяг еквівалентний 25 мільйонам книг у форматі PDF. Для порівняння, найбільша бібліотека у світі – Бібліотека Конгресу США – містить приблизно 17 мільйонів одиниць зберігання.
Внутрішній спротив і моральні дилеми
Ще у жовтні 2022 року один із провідних дослідників Meta писав у корпоративному листуванні:
“Використання піратських матеріалів виходить за межі наших етичних норм”.
Однак через три місяці Марк Цукерберг особисто дав зелене світло продовженню проєкту, під час наради зазначивши:
“Нам потрібно знайти спосіб обійти це обмеження”.
Курйозні деталі
Співробітники Meta не приховували, що використовують піратський контент. Деякі навіть завантажували файли через корпоративні ноутбуки, обговорюючи це в робочому чаті:
“Тягнути піратський контент з офісного комп’ютера – це як їсти попкорн у кінотеатрі через гучномовець”.
Ця історія викликала широкий резонанс у сфері авторських прав та поставила під сумнів законність підходів Meta до навчання AI.