Google оголосила про запуск нової штучної інтелектуальної моделі Gemini, яка стане ключовим компонентом ШІ-функцій компанії, кинувши виклик для конкурентів, включаючи ChatGPT від OpenAI. Генеральний директор Google Сундар Пічаї підкреслив, що поява цього нового алгоритму символізує настання нової епохи в розвитку штучного інтелекту.
Про це пише РБК-Україна (проект Styler) із посиланням на веб-сайт про комп'ютерну техніку та гаджети The Verge.
Гендиректор Google підкреслив, що випуск мовної моделі Gemini є значним кроком вперед, який в кінцевому підсумку вплине на майже всі продукти компанії. Вона є чимось більшим, ніж одна мовна модель.
Існує легша версія ШІ-моделі, відома як Gemini Nano, призначена для автономної роботи на пристроях з Android.
Паралельно з цим існує потужніша версія - Gemini Pro, яка в майбутньому стане основою для багатьох сервісів Google і вже сьогодні є базою для чат-бота Bard.
Додатково Google розробила ШІ-модель Gemini Ultra, яка є найпотужнішою в лінійці мовних моделей компанії. Вона в основному призначена для використання в центрах обробки даних та інтеграції з корпоративними програмами.
Компанія представляє свою ШІ-модель на ринку споживчих товарів декількома способами. Тепер чат-бот Bard функціонує на базі Gemini Pro, а власники Pixel 8 Pro можуть скористатися новими можливостями завдяки інтеграції з Gemini Nano.
Можливість використання Gemini Ultra стане доступною наступного року. З 13 грудня розробники та корпоративні клієнти зможуть отримати доступ до Gemini Pro через Google Generative AI Studio або Vertex AI у хмарній платформі Google Cloud.
На даний момент Gemini здатний обробляти запити лише англійською, але в майбутньому планується додати підтримку інших мов. Згідно із заявою Сундара Пічаї, дана ШІ-модель зрештою буде вбудована в пошукову систему Google, рекламні продукти компанії, браузер Chrome та інші сервіси.
Під час презентації Gemini гендиректор Google DeepMind Деміс Гассабіс повідомив, що компанія провела ретельне порівняння своєї мовної моделі з GPT-4, останньою версією нейромережі, що лежить в основі ChatGPT.
"Ми провели дуже ретельний порівняльний аналіз систем. Я думаю, що ми суттєво випереджаємо конкурента за 30 із 32 показників", - сказав Гассабіс, вказуючи на 32 добре зарекомендовані тести порівняння великих мовних моделей. Він також зазначив, що в деяких тестах перевага Gemini над GPT-4 мінімальна, тоді як в інших вона більш відчутна.
У цих тестах найбільшою перевагою Gemini стала його здатність розуміти відео та аудіо, а також взаємодіяти з ними. Загалом Google дотримується ідеї інтегрувати ці можливості безпосередньо в Gemini, на відміну від OpenAI, яка створила окремі ШІ-моделі для обробки зображень та аудіо, такі як DALL-E та Whisper.
На даний момент базові версії Gemini підтримують тільки текстове введення та виведення, але більш потужні версії алгоритму, включаючи Gemini Ultra, здатні працювати із зображеннями, відео та аудіо.
Презентація Gemini явно демонструє, що Google розглядає новий алгоритм як масштабний проект та важливий крок уперед для всієї компанії.
Gemini є ШІ-модель, до якої Google рухалася багато років, можливо, навіть перш, ніж з'явився ChatGPT. Компанія доклала багато зусиль, щоб забезпечити безпеку та надійність Gemini, провівши внутрішнє та зовнішнє тестування алгоритму, але, згідно з заявами керівництва, це не гарантує, що нейромережа працюватиме абсолютно без помилок.
Нагадаємо, що Google шукає для України нового регіонального директора.
А ще ми писали, що Google представила нові функції для Android, Wear OS та Android TV.