Представлено нову модель ШІ, яка може перевершити DeepSeek: подробиці

Китайська технологічна компанія Alibaba (9988.HK) у середу представила оновлену версію своєї моделі штучного інтелекту Qwen 2.5, заявивши, що вона перевершує широко визнану DeepSeek-V3.
Про це пише РБК-Україна (проект Styler) з посиланням на міжнародне інформаційне агентство Reuters.
Що відомо про нову модель ШІ
Незвичайний час випуску Qwen 2.5-Max - у перший день Китайського Нового року, коли більшість китайців перебувають у відпустці та проводять час із сім'ями, - вказує на зростаючий тиск з боку стрімкого злету DeepSeek. За останні три тижні стартап викликав ажіотаж не тільки серед зарубіжних конкурентів, а й серед місцевих технологічних гігантів.
"Qwen 2.5-Max перевершує практично за всіма параметрами GPT-4o, DeepSeek-V3 і Llama-3.1-405B", - заявив хмарний підрозділ Alibaba в офіційному оголошенні в WeChat, посилаючись на найпросунутіші відкриті ШІ-моделі OpenAI і Meta.
Випуск 10 січня ШІ-асистента DeepSeek, заснованого на моделі DeepSeek-V3, а також реліз DeepSeek-R1 20 січня потрясли Кремнієву долину. Вартість акцій технологічних компаній впала, оскільки заявлені низькі витрати на розробку і використання китайської моделі змусили інвесторів сумніватися в багатомільярдних витратах найбільших ШІ-компаній у США.
Але успіх DeepSeek викликав перегони серед китайських конкурентів за оновлення власних ШІ-моделей.
Через два дні після виходу DeepSeek-R1 власник TikTok ByteDance презентував оновлення свого флагманського ШІ, заявивши, що він перевершує OpenAI o1 (підтримуваний Microsoft) у тесті AIME, що оцінює здатність моделей розуміти і виконувати складні інструкції. Це підтверджує заяву DeepSeek про те, що його R1 можна порівняти з OpenAI o1 за низкою показників.
DeepSeek проти місцевих конкурентів
Попередник DeepSeek-V3, модель DeepSeek-V2, викликав "цінову війну" на ринку ШІ в Китаї після свого випуску в травні 2023 року.
Факт, що DeepSeek-V2 був open-source і надзвичайно дешевим (лише 0,14 доларів за 1 мільйон токенів), змусив Alibaba Cloud оголосити про зниження цін на ШІ-моделі до 97 відсотків. За нею пішли інші китайські технологічні гіганти, включно з Baidu (9888.HK), що випустила перший китайський аналог ChatGPT у березні 2023 року, і найбільшою інтернет-компанією Китаю Tencent (0700.HK).
Засновник DeepSeek Лян Веньфен у рідкісному інтерв'ю китайському виданню Waves у липні заявив, що стартап "не цікавить цінова війна", оскільки його головна мета - досягнення AGI (штучного загального інтелекту).
OpenAI визначає AGI як автономні системи, що перевершують людей у більшості економічно значущих завдань.
Тоді як Alibaba та інші китайські гіганти налічують сотні тисяч співробітників, DeepSeek функціонує радше як дослідницька лабораторія. У команді працюють випускники та докторанти провідних китайських університетів.
Лян стверджує, що найбільші технологічні корпорації Китаю можуть не вписатися в майбутнє індустрії ШІ, оскільки їхні високі витрати та ієрархічна структура заважають гнучкості та швидкості інновацій.
"Великі базові моделі вимагають постійного розвитку, а можливості технологічних гігантів не безмежні", - наголосив він.
Нагадаємо, що український експерт розповів, чи можна використовувати DeepSeek.
А ще у нас є матеріал про те, що таке DeepSeek і чому "новий король ШІ" так лякає гігантів технологій.