OpenAI Конкурує з Meta та DeepSeek Завдяки Двом Новим Моделям

В компанії OpenAI вівторка оголосили про запуск двох нових моделей з відкритими вагами, щоб змагатися з розвитком компаній Meta та DeepSeek. Однак ці моделі є лише частково відкритими: розробники не отримують вихідний код або дані для навчання.

Нові моделі gpt-oss від OpenAI представлені у двох варіантах: з 120 мільярдами та 20 мільярдами параметрів, які представляють собою статистичні зв’язки, засвоєні моделлю під час навчання. Загалом, чим більше кількість параметрів, тим вища здатність моделі.

«Ми вважаємо, що це найкраща і найбільш зручна відкрита модель у світі», — зазначив генеральний директор OpenAI Сем Альтман у своєму пості.

Останній раз OpenAI випустила відкриту модель у 2019 році з GPT-2. Однак GPT-2 була повністю відкритою — що дійсно робило її відкритим програмним забезпеченням, хоча й у поетапному режимі. OpenAI не повідомила, чи буде gpt-oss зрештою також відкритим.

Gpt-oss є текстовою моделлю з відкритими вагами, що означає, що користувач може використовувати та налаштовувати модель, але не знає, як вона була навчена або на яких даних.

Без доступу до даних, на яких побудовано модель, компанії не отримують повної прозорості, що може створити ризики для підприємств у фінансовій сфері, охороні здоров’я та інших суворо регульованих галузях.

Наприклад, компанія в охороні здоров’я може захотіти ретельно перевірити процес навчання моделі перед її застосуванням до персональних даних пацієнтів.

«Якщо доступні лише відкриті ваги, у розробників не буде змоги суттєво оцінити упередження, обмеження та соціальні впливи», — йдеться у повідомленні Інституту досліджень запитів та штучного інтелекту.

Проте OpenAI надає доступ під ліцензією Apache 2.0, яка гарантує користувачеві «вічні, всесвітні, невиключні, безкоштовні, безроялті, незворотні авторські права» для виробництва та розподілу моделі.

«Ці відкриті моделі також знижують бар’єри для нових ринків, секторів з обмеженими ресурсами та менших організацій, які можуть не мати бюджету або гнучкості для впровадження комерційних моделей», — зазначає OpenAI.

Користувачі можуть завантажити GPT-OSS на Hugging Face або переглянути на GitHub.

Перегони моделей в OpenAI

Основними претендентами на лідерство у сфері відкритих джерел є Meta зі своїми моделями Llama, але з обмеженнями щодо використання та розподілу; французька компанія Mistral AI; а також китайські постачальники, такі як DeepSeek та Alibaba з більшістю своїх моделей Qwen.

Альтман назвав gpt-oss «вагомою подією» з «значною практичною продуктивністю», що порівнянна з o4-mini. (О, або омні, серія складається з моделей reasoning OpenAI — нова родина моделей після серії GPT.)

Наприклад, у тесті MMLU, який оцінює, як добре LLM впораються з широким спектром академічних та професійних завдань, gpt-oss значно не відстає від OpenAI o3 та o4-mini за продуктивністю.

OpenAI повідомила, що модель gpt-oss з 120 мільярдами параметрів може працювати на комп’ютері користувача, а менш потужна модель може запускатися на смартфоні. Зазвичай, AI моделі, особливо великі, працюють у хмарі.

Хоча випуск відкритої моделі означає, що зловмисники можуть використовувати її для недобрих цілей, Альтман зазначив, що компанія вважає, що «позитивних наслідків буде набагато більше, ніж негативних». Це є відступом від 2019 року, коли OpenAI випустила GPT-2 поетапно, побоюючись, що її використають для поганих цілей.

Інші моделі OpenAI залишаються закритими і комерційними. Її конкуренти випустили різні рівні відкритих моделей: Google має моделі з відкритими вагами, але не відкриті для користування, такі як Gemma. Anthropic не має відкритої моделі. Microsoft відкрила свої моделі Phi. Моделі Amazon є комерційними.

Перегони моделей в OpenAI

Бєляєва Христина

Related Posts