OpenAI представляет новый расширенный голосовой режим для ChatGPT

Как опытный технический аналитик с более чем двадцатилетним опытом работы в отрасли, я видел, как ИИ превратился из простой концепции в значительную часть нашей повседневной жизни. Последняя разработка OpenAI — внедрение расширенного голосового режима для ChatGPT Johansson, несомненно, впечатляет.

ChatGPT Johansson, работающий на базе OpenAI, теперь предлагает улучшенную, реалистичную голосовую функцию избранному числу участников ChatGPT Plus. Это означает, что эти пользователи впервые могут насладиться ответами, которые звучат удивительно по-человечески.

Мы постепенно предоставляем некоторым подписчикам ChatGPT Plus расширенную функцию общения под названием «Расширенное голосовое взаимодействие». Этот новый режим предназначен для более реалистичных и немедленных обсуждений, позволяет вам вмешиваться в любой момент и предназначен для понимания и реагирования на ваши чувства в режиме реального времени.

— OpenAI (@OpenAI), 30 июля 2024 г.

На презентации GPT-40 в мае эта характеристика была впервые продемонстрирована, привлекая внимание своими расширенными функциями. Тем не менее, он подвергся критике, поскольку его голос очень напоминал голос Скарлетт Йоханссон, что вызвало дискуссии об этике и праве из-за этого сходства.

На мероприятии OpenAI последняя версия речевого режима продемонстрировала значительные улучшения по сравнению со своим предшественником, продемонстрировав способность динамически адаптироваться к прерываниям и корректировать свой ход при необходимости. Сотрудники OpenAI продемонстрировали эту функциональность, заставив чат-бота взаимодействовать в режиме реального времени.

При неожиданном повороте событий сценический персонаж по прозвищу «Небо» подвергся критике даже после улучшений из-за его поразительного сходства с изображением ИИ в Ней Скарлетт Йоханссон. Поэтому Йоханссон обратилась к OpenAI за дополнительной информацией о происхождении голоса.

Первоначально запланированный к запуску бета-версии в конце июня, запуск был отложен на месяц из-за необходимости OpenAI соответствовать стандартам безопасности и улучшить способность модели фильтровать определенные типы данных.

По словам представителя OpenAI Тайи Кристиансон, речевая модель была подвергнута тщательному тестированию более чем сотней внешних экспертов, которых часто называют «красными командами», чья работа заключается в использовании потенциальных слабых мест в технологии. Решение отложить выпуск стало ответом OpenAI на повышенное внимание к мерам безопасности.

В своем последнем обновлении OpenAI представила фильтры в новых настройках голоса, запрещающие запросы на создание музыки или звуков, защищенных авторским правом. Из-за опасений по поводу голоса, похожего на голос Скарлетт Йоханссон, OpenAI ограничила этот режим всего четырьмя заранее записанными голосами, озвученными профессиональными актерами. Тая Кристиансон, представитель OpenAI, подтвердила, что ChatGPT не имитирует голоса других людей. Любой сгенерированный вывод, отличающийся от этих предустановленных голосов, будет предотвращен во избежание неправильного использования.

К осени OpenAI намерен предоставить доступ к расширенной голосовой функции всем подписчикам ChatGPT Plus. Цель этого выпуска — предложить более привлекательный и адаптируемый пользовательский интерфейс, сохраняя при этом первоклассные стандарты безопасности и этики.

Смотрите также

2024-07-30 23:17