Представлено нову модель ШІ, яка може перевершити DeepSeek: подробиці

Середа 29 січня 2025 12:15

Нова ШІ-модель кидає виклик DeepSeek (фото: Getty Images)

Китайська технологічна компанія Alibaba (9988.HK) у середу представила оновлену версію своєї моделі штучного інтелекту Qwen 2.5, заявивши, що вона перевершує широко визнану DeepSeek-V3.

Про це пише РБК-Україна (проект Styler) з посиланням на міжнародне інформаційне агентство Reuters.

Що відомо про нову модель ШІ

Незвичайний час випуску Qwen 2.5-Max - у перший день Китайського Нового року, коли більшість китайців перебувають у відпустці та проводять час із сім'ями, - вказує на зростаючий тиск з боку стрімкого злету DeepSeek. За останні три тижні стартап викликав ажіотаж не тільки серед зарубіжних конкурентів, а й серед місцевих технологічних гігантів.

"Qwen 2.5-Max перевершує практично за всіма параметрами GPT-4o, DeepSeek-V3 і Llama-3.1-405B", - заявив хмарний підрозділ Alibaba в офіційному оголошенні в WeChat, посилаючись на найпросунутіші відкриті ШІ-моделі OpenAI і Meta.

Випуск 10 січня ШІ-асистента DeepSeek, заснованого на моделі DeepSeek-V3, а також реліз DeepSeek-R1 20 січня потрясли Кремнієву долину. Вартість акцій технологічних компаній впала, оскільки заявлені низькі витрати на розробку і використання китайської моделі змусили інвесторів сумніватися в багатомільярдних витратах найбільших ШІ-компаній у США.

Але успіх DeepSeek викликав перегони серед китайських конкурентів за оновлення власних ШІ-моделей.

Через два дні після виходу DeepSeek-R1 власник TikTok ByteDance презентував оновлення свого флагманського ШІ, заявивши, що він перевершує OpenAI o1 (підтримуваний Microsoft) у тесті AIME, що оцінює здатність моделей розуміти і виконувати складні інструкції. Це підтверджує заяву DeepSeek про те, що його R1 можна порівняти з OpenAI o1 за низкою показників.

DeepSeek проти місцевих конкурентів

Попередник DeepSeek-V3, модель DeepSeek-V2, викликав "цінову війну" на ринку ШІ в Китаї після свого випуску в травні 2023 року.

Факт, що DeepSeek-V2 був open-source і надзвичайно дешевим (лише 0,14 доларів за 1 мільйон токенів), змусив Alibaba Cloud оголосити про зниження цін на ШІ-моделі до 97 відсотків. За нею пішли інші китайські технологічні гіганти, включно з Baidu (9888.HK), що випустила перший китайський аналог ChatGPT у березні 2023 року, і найбільшою інтернет-компанією Китаю Tencent (0700.HK).

Засновник DeepSeek Лян Веньфен у рідкісному інтерв'ю китайському виданню Waves у липні заявив, що стартап "не цікавить цінова війна", оскільки його головна мета - досягнення AGI (штучного загального інтелекту).

OpenAI визначає AGI як автономні системи, що перевершують людей у більшості економічно значущих завдань.

Тоді як Alibaba та інші китайські гіганти налічують сотні тисяч співробітників, DeepSeek функціонує радше як дослідницька лабораторія. У команді працюють випускники та докторанти провідних китайських університетів.

Лян стверджує, що найбільші технологічні корпорації Китаю можуть не вписатися в майбутнє індустрії ШІ, оскільки їхні високі витрати та ієрархічна структура заважають гнучкості та швидкості інновацій.

"Великі базові моделі вимагають постійного розвитку, а можливості технологічних гігантів не безмежні", - наголосив він.

Нагадаємо, що український експерт розповів, чи можна використовувати DeepSeek.

А ще у нас є матеріал про те, що таке DeepSeek і чому "новий король ШІ" так лякає гігантів технологій.

Читайте РБК-Україна в Google News