Alibaba представила оновлений ШІ, який, за словами компанії, обігнав DeepSeek
1 min read

Alibaba представила оновлений ШІ, який, за словами компанії, обігнав DeepSeek

Китайська корпорація Alibaba представила оновлену версію своєї мовної моделі Qwen 2.5, підкресливши, що її можливості перевищують навіть “гучно анонсовану” DeepSeek-V3.

Про це повідомляє агентство Reuters.

Оновлення Qwen 2.5-Max було випущено на перший день святкування китайського Нового року за місячним календарем, коли більшість китайців перебуває на вихідному. Це стало додатковим підтвердженням сильного тиску з боку DeepSeek не лише на зарубіжних, а й на місцевих конкурентів. За словами представників Alibaba, нова модель значно переважає в більшості аспектів GPT-4, DeepSeek-V3 та Llama-3.1-405B, порівнюючи її з провідними моделями OpenAI і Meta.

Разом із Tencent та Baidu, Alibaba зробила суттєві інвестиції в хмарні сервіси, що відображає вплив на ринок технологій. Стартап DeepSeek, заснований у Ханчжоу, рідному місті Alibaba, швидко став еталоном, до якого корпорація прагне наблизитися.

Що таке DeepSeek

Що стосується самого стартапу DeepSeek, то його засновником є 40-річний Лянь Веньфенг, який раніше працював з чипами Nvidia A100. Після введення обмежень на експорт цих чипів у Китай він вирішив створити DeepSeek, поєднавши ці компоненти з доступнішими чипами нижчого класу.

Модель DeepSeek-V3 розроблена з відкритим вихідним кодом, і деякі експерти стверджують, що її розробка обійшлася менше ніж $6 мільйонів — значно менше, ніж витрати конкурентів. Однак не всі погоджуються з цією цифрою.

Ця розробка набула популярності на фоні обмежень Вашингтона щодо продажу високотехнологічних чипів до Китаю, що спричинило нову хвилю колаборації між китайськими розробниками. Це призвело до створення моделей ШІ, які вимагають значно менше обчислювальних ресурсів і, відповідно, є набагато дешевшими, що має потенціал докорінно змінити індустрію.

На початку січня DeepSeek похвалився рівнем продуктивності, що дозволяє з успіхом вирішувати складні математичні задачі та писати код, порівнюючи свої досягнення з продуктами OpenAI. Популярність DeepSeek вже вплинула на фінансові ринки, зокрема, акції ASML і Siemens Energy зазнали суттєвих падінь.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *