OpenAI представила Operator, продвинутый ИИ-агент, предназначенный для автоматизации веб-задач с минимальным человеческим вмешательством. В настоящее время он доступен только для Pro-подписчиков в США.
Operator использует модель Computer-Using Agent (CUA), которая сочетает мультимодальные возможности GPT-4o с продвинутым мышлением и обучением. Это позволяет ему взаимодействовать с графическими интерфейсами, как человек, следуя инструкциям пользователей.
Инструмент автоматизирует действия в браузере, обрабатывая данные скриншотов и имитируя ввод с помощью мыши или клавиатуры. OpenAI намерена улучшить инструмент на основе отзывов пользователей, планируя более широкое развертывание после завершения тестирования.
Operator был протестирован с уровнем успеха 87% на таких сайтах, как Amazon, хотя производительность падает до 58,1% на других тестах. Компания работает над улучшением этих показателей со временем.
Меры безопасности включают одобрение пользователей для значительных действий и мониторинг доступа к чувствительным сайтам. Инструмент блокирует рискованные операции, такие как банковские переводы, и обеспечивает конфиденциальность, позволяя пользователям отказаться от обучения данных.
Компании, такие как DoorDash и Uber, сотрудничают с OpenAI для оптимизации Operator для повседневных задач. Компания планирует интегрировать эти функции в ChatGPT и выпустить CUA через API для разработчиков.