Meta в центрі скандалу: піратський контент для навчання AI
1 min read

Meta в центрі скандалу: піратський контент для навчання AI

Нещодавно корпорація Meta опинилася під прицілом звинувачень у використанні неліцензійного контенту для тренування штучного інтелекту.

Про це повідомляє terazus.com.

Судові матеріали розкривають, що замість офіційних баз даних компанія масово завантажувала книги з піратських ресурсів, а внутрішнє листування співробітників демонструє їхню обізнаність щодо сумнівних методів.

Колосальні обсяги піратського контенту

Документи судового розгляду вказують, що Meta отримала 81,7 ТБ нелегальних даних з різних джерел, зокрема:

  • 54 ТБ із Z-Library – відомої піратської бібліотеки, яку ФБР частково заблокувало у 2022 році.
  • 10 ТБ із LibGen – ще одного нелегального архіву, пов’язаного з російськими серверами.
  • 17,7 ТБ із Sci-Hub та інших ресурсів.

Загальний обсяг еквівалентний 25 мільйонам книг у форматі PDF. Для порівняння, найбільша бібліотека у світі – Бібліотека Конгресу США – містить приблизно 17 мільйонів одиниць зберігання.

Внутрішній спротив і моральні дилеми

Ще у жовтні 2022 року один із провідних дослідників Meta писав у корпоративному листуванні:
“Використання піратських матеріалів виходить за межі наших етичних норм”.

Однак через три місяці Марк Цукерберг особисто дав зелене світло продовженню проєкту, під час наради зазначивши:
“Нам потрібно знайти спосіб обійти це обмеження”.

Курйозні деталі

Співробітники Meta не приховували, що використовують піратський контент. Деякі навіть завантажували файли через корпоративні ноутбуки, обговорюючи це в робочому чаті:
“Тягнути піратський контент з офісного комп’ютера – це як їсти попкорн у кінотеатрі через гучномовець”.

Ця історія викликала широкий резонанс у сфері авторських прав та поставила під сумнів законність підходів Meta до навчання AI.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *