Как опытный криптоинвестор и энтузиаст технологий с более чем двадцатилетним опытом работы за плечами, я должен признать, что последнее объявление Google, Gemini Live, значительно пробудило мой интерес. Будучи свидетелем эволюции ИИ с момента его зарождения, я видел бесчисленное количество обещаний и мало результатов. Однако с Gemini Live кажется, что мы наконец вступаем в новую эру, когда разговоры с искусственным интеллектом кажутся более человеческими и естественными.
На мероприятии Made by Google в 2024 году компания Google представила нового конкурента расширенного голосового режима OpenAI для ChatGPT: новую функцию под названием Gemini Live. Эта инновационная услуга теперь доступна тем, у кого есть обновленный пакет подписки Gemini.
Цель этой функции — сделать общение с ИИ более естественным и плавным. С помощью Gemini Live пользователи могут переключаться между темами, прерывать или продолжать разговор так же, как с реальным человеком.
Как частый пользователь технологии голосового управления, я могу с уверенностью сказать, что последнее обновление моего устройства значительно улучшило мою повседневную жизнь. Благодаря новому речевому процессору, предлагающему десять реалистичных голосов, создается впечатление, будто я разговариваю с реальным человеком. Возможность имитировать собственную речь в реальном времени особенно впечатляет и помогает мне выполнять несколько задач более эффективно, чем когда-либо прежде.
С помощью моделей Gemini 1.5 Pro и Gemini 1.5 Flash эта функция обеспечивает расширенные и плавные диалоги благодаря расширенному расширению контекстного окна. Кроме того, позже в этом году он будет поддерживать мультимодальный ввод, обеспечивающий взаимодействие посредством визуальных подсказок, таких как изображения и видео.
В настоящее время доступ к Gemini Live на устройствах Android возможен исключительно на английском языке, однако дополнительные языки и совместимость с iOS находятся в стадии разработки. В ближайшем будущем у вас появится возможность использовать Gemini вместе с другими приложениями Google, такими как Calendar, Keep и YouTube Music. Это позволит вам управлять своими задачами, используя только голос.
С другой стороны, расширенный голосовой режим OpenAI для ChatGPT, хотя и является инновационным, подвергся некоторой критике. Некоторые пользователи опасаются, что это может привести к чрезмерной зависимости от ИИ, что потенциально повлияет на отношения в реальном мире.
В ответ OpenAI концентрируется на совершенствовании своих моделей искусственного интеллекта, чтобы они были не только мощными, но также безопасными и удобными для повседневных приложений.
Gemini Live, похоже, совершает революцию в чатах с искусственным интеллектом, предлагая более аутентичный и адаптируемый опыт общения. Благодаря возможностям имитации речи в реальном времени и поддержке многозадачности он потенциально может конкурировать с услугами, предоставляемыми OpenAI.
Смотрите также
2024-08-14 08:21