На днях OpenAI представила новый режим продвинутого голосового управления для ChatGPT. Группа подписчиков ChatGPT Plus, которым предоставлен доступ к этой функции, уже успела оценить ее возможности. В сети появилось множество видеороликов, демонстрирующих различные способности бота, такие как пение, имитация акцентов, корректировка произношения и повествование.
Пример последнего можно увидеть в видео, опубликованном пользователем @nickfloats на платформе X. Он попросил ChatGPT рассказать историю так, как будто это делает пилот самолета для своих пассажиров. Буквально через секунду бот начал рассказывать, причем аудио было изменено так, чтобы звучать как сообщение по интеркому. Хотя ChatGPT пока сложно выполнять более сложные задачи, например, добавление звуков двигателя, его голос звучит четко и эмоционально, а также бот хорошо справляется с прерываниями со стороны пользователя.
Во время разговора, загруженного на YouTube, ChatGPT отметил, что может обрабатывать запросы на «десятках языков», хотя точное количество зависит от того, как считать диалекты и региональные вариации. В одном из видео был продемонстрирован процесс корректировки произношения французских слов, с указанием на конкретные изменения в интонации. В другом ролике видно, как ChatGPT рассказывает эмоциональную историю на турецком языке. Несмотря на то, что некоторые пользователи отметили не совсем аутентичный акцент, бот завершил рассказ и соответственно реагировал, смеясь и плача в нужные моменты.
При демонстрациях использовались различные голоса, как мужские, так и женские. Однако среди них не было голоса «Sky», напоминающего голос Скарлетт Йоханссон, который был удален из сервиса в мае.
Для тех, кто не смог протестировать новый режим, представитель OpenAI, Тая Кристиансон, сообщила The Verge, что продвинутый голосовой режим станет доступен для всех подписчиков ChatGPT Plus этой осенью. Стоимость подписки составляет 20 долларов в месяц.
Источник: TheVerge