Разработчики OpenAI выпустили глобальный апдейт для чат-бота ChatGPT, который научился видеть, слышать и говорить. Обновление знаменует важный шаг в развитии искусственного интеллекта, который может воспринимать и обрабатывать информацию в нескольких форматах, а не только в текстовом. Кроме того, чат научился выходить в Интернет.
Об этом сообщает РБК-Украина (проект Styler) со ссылкой на OpenAI.
Обновленный чат-бот умеет слышать и узнавать язык пользователей. Любой запрос к искусственному интеллекту можно сделать с помощью голоса, уже напоминающего виртуальных помощников вроде Siri от Apple.
Для начала работы с языковыми функциями необходимо включить их в настройках программы. ChatGPT предлагает выбор из пяти разных голосов - "можжевельник", "бухта", "небо", "бриз" и "уголь". В их записи участвовали профессиональные актеры.
"Новая технология, способная создавать реалистичные синтетические голоса всего за несколько секунд прослушивания реального языка, открывает двери для многих творческих приложений, ориентированных на доступность", - отметили в OpenAI.
Новой функцией уже пользуется стриминговый сервис Spotify для перевода подкастов на другие языки, сохраняя оригинальный голос ведущего.
Ранее система на основе искусственного интеллекта училась только по данным до сентября 2021 года.
Однако теперь ChatGPT получил доступ в сеть. Это означает, что пользователи скоро смогут задавать чат-боту вопросы о текущих событиях и просматривать новости.
Пользователи также могут отправлять ChatGPT различные изображения в дополнение к обычным запросам. Функция Vision или GPT-V помогает нейросетям давать более точные ответы.
В качестве примера разработчики привели ситуацию, когда необходимо что-то починить. Область поломки можно обвести инструментами для рисования для облегчения задания чат-бота.
Основная цель OpenAI - создание безопасного и полезного общего искусственного интеллекта (AGI). Однако вопрос защиты пользователей стал более актуальным с появлением новых функций.
По мнению разработчиков, возможность преобразования голоса открывает новые возможности для мошенников. К примеру, преступники могут создавать дипфейки, имитирующие известных личностей.
Визуальные модели также создают проблемы: от неправильной интерпретации изображений до оскорбительных мыслей о людях на фото. Перед запуском утилиты OpenAI протестировала ее с экспертами по борьбе с экстремизмом и неточных научных высказываний.
"Мы также приняли технические меры, чтобы значительно ограничить способность нейросети анализировать и делать прямые заявления о людях, поскольку ChatGPT не всегда точен, и эти системы должны уважать конфиденциальность", - подчеркнули в OpenAI.
Все пользователи платной версии ChatGPT получат доступ к новым вариантам запросов в течение двух недель, а вскоре после этого доступ откроют пользователям без подписки.
Кстати, мы раньше писали, что ChatGPT стремительно теряет пользователей.
А еще мы писали о том, как YouTube ввел искусственный интеллект в редактор видео.