DeepSeek Представляє Оновлену Версію Моделі Системи Штучного Інтелекту Для Своєї Чат-бота

Китайська стартап-компанія в галузі штучного інтелекту DeepSeek представила нову версію свого відкритого AI-моделі, яка лежить в основі її суперечливого чат-бота.

Відповідно до інформації, опублікованої в офіційній групі DeepSeek в WeChat, готова до тестування версія V3.1.

Нова версія має значно більший контекстний вікно — 128 000 токенів, що еквівалентно приблизно 96 000 слів або двом романам англійською мовою по 200 сторінок.

Модель V3 DeepSeek викликала багато обговорень в січні, коли стартап повідомив, що її навчання коштувало лише 5,6 мільйонів доларів, задіявши близько 2 000 повільних чіпів Nvidia.

Ціна навчання була значно нижчою, ніж мільйони доларів, необхідні для підготовки передових моделей від OpenAI, Google, Anthropic та інших. Ця новина призвела до зниження ринкової вартості Nvidia на 600 мільярдів доларів за один день. Однак уряди швидко заборонили використання чат-бота DeepSeek, побоюючись, що дані зберігатимуться на китайських серверах.

Хоча стартап не надав більше деталей у WeChat, одне з повідомлень на Reddit вказує на те, що остання версія чат-бота “дуже, дуже багатослівна”, і також було помічено, що “r1 у кнопці мислення” зникла, що свідчить про те, що V3.1 може бути змішаною моделлю розумування.

R1 — це модель розумування, яку також розробив DeepSeek. Вона доступна через три основні хмарні платформи США: AWS, Microsoft Azure і Google Cloud. Ці постачальники послуг стверджують, що модель розміщується локально, тому дані не будуть передані в Китай.

Розробники все ще чекають на R2, наступний реліз моделі R1.

У світовій гонці штучного інтелекту лише Китай здатний ефективно конкурувати зі США. Китайські компанії, такі як Alibaba, DeepSeek і Moonshot, розробили моделі ШІ, які за можливостями наближаються до найкращих американських.

Поки США покладаються на в основному закриті, proprietary моделі ШІ, Китай просуває відкриті моделі, які зазвичай безкоштовно завантажувати та використовувати. Китай жертвує короткостроковими прибутками, щоб забезпечити глобальне впровадження своїх AI-технологій. Чотирнадцята п’ятирічка розвитку Китаю, опублікована у 2020 році, підтримала відкритий підхід. Деякі керівники китайських стартапів у сфері штучного інтелекту також вважають, що найшвидший шлях для виходу на нові ринки та конкуренції з американськими моделями — це пропозиція відкритих AI-моделей.

Бєляєва Христина

Related Posts