Google и проект «Дикие дельфины» создали ИИ-модель, обученную распознавать звуки дельфинов.
Модель DolphinGemma способна функционировать прямо на смартфонах Pixel.
Этим летом она будет выложена в открытый доступ.
На протяжении большей части истории отношения между людьми и дельфинами были односторонними: мы говорили, они пищали, и мы кивали, притворяясь, что понимаем. Теперь Google намерен с помощью ИИ изменить эту ситуацию. Вместе с Технологическим институтом Джорджии и проектом «Дикие дельфины» компания Google разработала новую ИИ-модель DolphinGemma, которая способна понимать и даже генерировать дельфиньи звуки.
Проект «Дикие дельфины» с 1985 года собирает данные о стае диких атлантических пятнистых дельфинов на Багамах. Эти дельфины стали источником обширной аудио, видео и поведенческой информации для исследований. Все эти материалы были переданы DolphinGemma, созданной на основе Google Gemma. Она обрабатывает звуки дельфинов с помощью аудиотокенизаторов, таких как SoundStream, и предсказывает, какой звук дельфин издаст дальше, подобно автозаполнению.
Модель настолько компактна, что может работать на смартфонах Google Pixel. Этим летом проект «Дикие дельфины» планирует использовать DolphinGemma на практике, оснащая Pixel 9 водонепроницаемой защитой. Модель будет в реальном времени распознавать звуковые узоры и помогать исследователям выявлять значимые последовательности.
Тем не менее, конечной целью проекта является не просто пассивное прослушивание. Технологический институт Джорджии и проект «Дикие дельфины» также разрабатывают систему CHAT (усиление слуха китообразных с телеметрией) — это двусторонняя система коммуникации между людьми и дельфинами. CHAT позволяет исследователям назначать синтетические свистки различным объектам, таким как водоросли и шарфы, и наблюдать, как дельфины имитируют эти звуки. Это похоже на создание общего языка с помощью подводных микрофонов.
DolphinGemma не только анализирует звуки дельфинов после их издания, но и помогает предсказывать будущие звуки, что позволяет быстрее реагировать и взаимодействовать. В сущности, это предсказательная клавиатура для дельфинов. Проект все еще на начальной стадии, но Google планирует открыть исходный код DolphinGemma в этом году, чтобы ускорить его развитие.
Изначально модель обучалась на звуках атлантических пятнистых дельфинов, но теоретически ее можно адаптировать для других видов с некоторой доработкой. Идея заключается в том, чтобы предоставить ключи к этой ИИ-модели исследователям, чтобы они могли применять ее к своим наборам данных. Задача — выявлять значимые звуковые паттерны из многолетних аудиозаписей, хотя на сегодня далеко не гарантировано, что звуковые сигналы дельфинов соотносятся с человеческим языком.
ИИ может быть использован для общения не только с дельфинами. Исследователи также разработали алгоритм, расшифровывающий эмоции свиней по их звукам, чтобы помочь фермерам следить за их состоянием. Однако дельфины остаются более харизматичными существами. Возможно, вскоре мы сможем спросить у дельфина, как добраться до нужного места, лишь бы только не уронить телефон в воду.
Источник: TechRadar