
Пам’ятаєте DeepSeek? Багато людей почали використовувати його AI моделі, незважаючи на проблеми з безпекою
Після резонансного старту в січні, що викликав занепокоєння з приводу національної безпеки, компанія DeepSeek поступово зникла з новин. Її чат-бот V3 та моделі reasoning R1 отримали як похвалу, так і критику, внаслідок чого кілька країн, зокрема США, заборонили їх використання в урядових установах.
Дивно, але моделі китайської компанії штучного інтелекту не зазнали краху, а навпаки — займають другі або треті місця у кількох категоріях, поступаючись лише ChatGPT від OpenAI та Gemini від Google. При цьому DeepSeek обігнала такі моделі, як Perplexity, Grok від xAI та Claude від Anthropic.
Розгляньте наступні дані з Similarweb:
Загальний трафік вебсайту у травні 2025 року
- ChatGPT: 5,492 мільярди
- Gemini: 527.7 мільйонів
- DeepSeek: 436.2 мільйони
- Grok: 178.6 мільйонів
- Perplexity: 178.6 мільйонів
- Claude: 99.68 мільйонів
Частка ринку генеративного ШІ
Шість місяців тому (перед тим, як DeepSeek потрапила в заголовки)
- ChatGPT: 87.5 %
- Google: 5.4 %
- Perplexity: 2.0 %
- Claude: 1.6 %
Станом на 10 червня:
- ChatGPT: 78.9 %
- Google: 8.0 %
- DeepSeek: 5.3 %
- Grok: 2.1 %
- Perplexity: 1.7 %
- Claude: 1.4 %
Згідно з даними «Wall Street Journal», американські компанії зацікавлені в можливості використання DeepSeek. CIO повідомляють, що вони “в захваті” від потенційного зниження витрат на ШІ в США, оскільки розробники починають використовувати методики DeepSeek.
DeepSeek заявила, що на навчання однієї зі своїх моделей витратила 5.6 мільйонів доларів, у порівнянні з 100 мільйонами до 1 мільярда, про що говорив CEO Anthropic Даріо Амодей, згідно з інформацією видання.
Економніше, розірване з Китаєм
Популярність DeepSeek, за словами аналітиків Bain & Co., пов’язана з її економічною ефективністю. “Ефективність DeepSeek очевидно ґрунтується на ряді інженерних інновацій, які значно знижують витрати на обробку без шкоди для якості навчання”, — зазначається в блозі.
Архітектура DeepSeek, що використовує змішання експертів, активує лише 37 мільярдів з 671 мільярда параметрів для обробки кожного току, що допомагає знизити обчислювальні витрати, зберігаючи продуктивність. Крім того, DeepSeek оптимізувала техніки дистиляції, які дозволяють переносити можливості розуміння з більших моделей на менші.
Дивовижно, що “китайський стартап з відкритим кодом зумів істотно зменшити різницю у продуктивності з провідними закритими моделями”, йдеться в статті.
Що стосується занепокоєння з приводу національної безпеки, то це залежить від того, яким чином користувач отримує доступ до моделей. Якщо компанія чи користувач завантажують ваги моделі та виконують обробку локально, дані не покинуть пристрій. Компанії також можуть використовувати моделі DeepSeek на своїх серверах або в приватних хмарах, щоб уникнути передачі інформації на зарубіжні сервери.
З іншого боку, використання мобільного додатку DeepSeek або веб-сервісу передбачає відправку даних на сервери в Китаї, що підпадає під контроль уряду Китаю.
Таким чином, підприємства можуть запобігти виведенню даних за межі країни, однак споживачі чи окремі користувачі зазвичай не можуть цього зробити. З цієї причини додатки DeepSeek зазнали заборон на використання для працівників уряду в США, Італії, Південній Кореї, Австралії, Тайвані та інших країнах.
Приватний сектор, однак, продовжує рухатися вперед.
У січні компанія Perplexity запропонувала DeepSeek R1 для виконання глибоких досліджень. Стартап заявив, що модель розміщується на серверах у США та ЄС, тому дані користувачів не потрапляють до Китаю. Також була створена версія DeepSeek R1, яка надає “неупереджену, точну та фактичну інформацію”. Модель отримала назву R1 1776 – на честь року проголошення незалежності США.
Хмарні гіганти AWS, Microsoft Azure та Google Cloud вже додали AI-модель R1 DeepSeek до своїх маркетплейсів. Хмарна компанія Snowflake повідомила, що почала пропонувати DeepSeek своїм клієнтам після того, як отримала кілька запитів від споживачів, згідно з інформацією Reuters.
Як моделі з відкритим кодом, вони також доступні через репозиторії коду Hugging Face та GitHub.
Найбільш активними користувачами стали китайські споживачі. Згідно з “People’s Daily”, державним виданням, китайські компанії, включаючи телекомунікаційні оператори, брокерські компанії та автовиробники, активно використовують DeepSeek.
Читати далі: DeepSeek покращує модель ШІ reasoning, щоб конкурувати з OpenAI та Google
Читати далі: DeepSeek пропонує суттєві знижки у неробочий час, щоб розподілити попит
Читати далі: DeepSeek зіткнувся з забороною на пристроях уряду США