Введение
На прошлой неделе OpenAI представила своего первого AI-агента под названием Operator. Однако у него уже появился серьезный конкурент — AI-инструмент Browser Use, который выполняет онлайн-задачи за пользователя. Этот агент, использующий компьютер (Computer-Using Agent, CUA), может писать, искать информацию, нажимать кнопки и копировать данные с веб-сайтов без необходимости использования мыши или клавиатуры.
Основные возможности и особенности Browser Use
Browser Use предлагает свои услуги бесплатно, особенно если пользователи готовы потратить время на изучение кода API. Для тех, кто не слишком разбирается в программировании, это может потребовать значительных усилий и времени. К счастью, недавно была выпущена облачная версия Browser Use, использующая модель GPT-4o от OpenAI. Она значительно упрощает взаимодействие, переводя его в привычный чат-формат. Стоимость использования такой версии составляет 30 долларов, что для многих пользователей, столкнувшихся с трудностями API, выглядит как вполне разумное предложение.
Тестирование Browser Use
Задача по сравнению цен
Первый тест, которому я подверг Browser Use, касался сравнения цен. Я задал запрос: «Перейдите на Amazon, Best Buy и Walmart и найдите ‘MacBook Air’. Выполните извлечение названия продукта, цены и наличия на складе для первых пяти результатов на каждом сайте. Сравните цены и выберите наименьшую. Если есть скидки или купоны, запишите их. Предоставьте итоговое резюме с лучшей сделкой и местом покупки». Агент успешно справился с задачей, хотя и не обнаружил скрытых скидок или купонов.
Планирование путешествий
Следующим этапом я проверил возможности планирования путешествий. Я задал запрос: «Найдите билет на рейс из Нью-Йорка в Лондон 15 декабря. Выберите наиболее дешевый вариант и извлеките детали, включая цену, авиакомпанию и время вылета». Browser Use успешно справился с этой задачей, предоставив информацию о рейсе British Airways стоимостью 750 долларов.
Прогноз погоды
Последним тестом стало прогнозирование погоды. Я ввел запрос: «Проверьте 7-дневный прогноз погоды для Нью-Йорка на weather.com и обобщите тренды температуры, шансы на дождь и любые предупреждения о погоде. Затем предложите, как одеваться». Агент хорошо справился и с этой задачей, предоставив рекомендации по выбору одежды в зависимости от прогноза.
Заключение
Основное различие между Browser Use и Operator заключается в доступности. Browser Use предоставляет широкий инструментарий разработчикам, позволяет вносить изменения в код и добавлять недостающие функции. Однако его облачная версия может требовать некоторых усилий со стороны пользователя в плане настройки и умения составлять запросы.
С другой стороны, Operator больше напоминает личного ассистента, который облегчает выполнение задач в пределах установленных рамок и интегрирован с более широкой экосистемой OpenAI. Выбор между этими инструментами зависит от предпочтений пользователя: либо гибкость Browser Use для энтузиастов и разработчиков, либо простота использования Operator для тех, кто не хочет углубляться в технические детали. В любом случае, автоматизация веб-задач набирает популярность и, вероятно, будет продолжать развиваться.
Источник: TechRadar