Генераторы изображений на основе искусственного интеллекта сейчас пользуются большой популярностью благодаря недавним улучшениям. На этой неделе к ним присоединился новый разработчик синтетических изображений — Ideogram, представивший версию Ideogram 2.0. Новая версия обещает превзойти как предыдущие разработки компании, так и конкурентов, благодаря ряду новых и улучшенных функций, а также новому приложению для iOS и доступной для поиска библиотеке более чем миллиарда созданных пользователями изображений.
Механизм текст-к-изображению в Ideogram 2.0 предоставляет пользователю гораздо больше контроля над формированием изображения, созданного ИИ. Теперь доступен выбор из нескольких различных стилей. Реалистичный стиль особенно интересен, так как он производит изображения, которые очень похожи на настоящие фотографии. Качество воспроизведения кожи, волос и других деталей значительно улучшено по сравнению с предыдущей версией Ideogram.
Стиль Дизайн, в свою очередь, сосредоточен на точности текста в изображениях, что является очень сложной задачей для ИИ-моделей. С помощью Ideogram 2.0 пользователи могут создавать графические дизайны с длинным стилизованным текстом, который при этом остается читаемым. Другие опции включают 3D для создания трехмерных объектов, которые можно вращать в реальном пространстве, Anime для создания изображений в стиле аниме и General, который не привязывает изображение к какому-либо определенному стилю.
Ideogram на ходу
Ideogram 2.0 также улучшил свои инструменты Magic Prompt и Describe. Magic Prompt расширяет первоначальную подсказку пользователя, тогда как Describe наоборот, создает текстовую подсказку на основе изображения. Эти инструменты теперь лучше справляются как с заполнением деталей по коротким текстовым подсказкам, так и с объяснением изображения словами.
Новая модель Ideogram оснащена приложением для iOS, которое позволяет пользователям создавать и настраивать изображения напрямую с мобильных устройств. Версия для Android также находится в разработке. Кроме того, компания выпустила бета-версию своего API, чтобы использовать модель Ideogram в других приложениях или на веб-сайтах. Это похоже на то, как Microsoft использует модель DALL-E от OpenAI или как X встроил Flux в чат-бот Grok AI. Ideogram сталкивается с конкуренцией со стороны многих разработчиков, но неоспоримым преимуществом является создание четких и фотореалистичных изображений с хорошо читаемым текстом.
Источник: TechRadar