Новый режим голосового взаимодействия ChatGPT от OpenAI
OpenAI начала постепенное внедрение своего нового продвинутого голосового режима для ChatGPT для ограниченного числа подписчиков ChatGPT Plus. Эта функция была впервые продемонстрирована на мероприятии по запуску GPT-4o в мае. Функция подверглась критике за сходство с голосом Скарлетт Йоханссон и позже была отложена по соображениям безопасности.
На мероприятии OpenAI новый голосовой режим показал себя значительно более способным по сравнению с текущей версией в ChatGPT. Сотрудники компании на сцене могли прерывать чат-бота и просить его рассказывать истории разными способами; бот корректировал свои ответы, учитывая эти прерывания.
Запуск продвинутого режима был намечен на альфа-версию в конце июня, но OpenAI решила отсрочить выпуск на месяц, чтобы удовлетворить свои стандарты качества. В рамках этой задержки компания заявила об улучшении способности модели обнаруживать и отклонять определённый контент. Представитель OpenAI Тая Кристиансен сообщила, что возможности голосовой модели тестировались более чем 100 внешними специалистами по безопасности. Последние проверки касались безопасности и соответствия политики компании по работе с искусственным интеллектом.
На мероприятии OpenAI одной из главных критик касательно нового режима было похожее на голос Скарлетт Йоханссон, которое было названо «Sky». Несмотря на то, что голос был доступен в ChatGPT до весенней демонстрации, компания удалила его после того, как Йоханссон направила письма в OpenAI с запросом о происхождении голоса.
По словам Кристиансен, новый режим ChatGPT будет использовать только четыре заранее настроенных голоса, созданных с помощью актёров озвучки. Также предусмотрены фильтры, предотвращающие имитацию голосов других людей, как частных лиц, так и общественных фигур, и блокирующие любые выходные данные, отличающиеся от настроенных голосов.
OpenAI планирует внедрить новый режим всем пользователям ChatGPT Plus осенью, согласно заявлению Таи Кристиансен.
Источник: TheVerge