OpenAI представила свого першого ШІ-агента Operator, який може переходити в Інтернет, щоб виконувати завдання, як-от забронювати квитки чи замовити доставку.
Як він працює
Він заснований на новій моделі Computer-Using Agent (CUA), який завдяки GPT-4o може «бачити» інтерфейс (через скріншоти) і «взаємодіяти» з ним, як за допомогою миші й клавіатури. Він працює без інтеграції через API, виконуючи дії напряму в браузері.
Він використовує передові алгоритми для роботи з інтерфейсом, міркує і виправляє помилки. У складних випадках передає керування користувачеві. З деякими завданнями, такими як управління календарями та створення слайд-шоу, поки є проблеми, кажуть в компанії.
Як його використовувати
- Потрібно описати завдання й Operator його виконає
- Можна взяти контроль у будь-який момент, наприклад, для введення паролів або розв’язання CAPTCHA.
- Є можливість налаштовувати завдання для конкретних сайтів, наприклад, параметри пошуку готелів
- Також можна зберігати підказки для повторюваних дій, як-от замовлення продуктів або бронювання
- Крім того, можна виконувати кілька завдань одночасно, як у звичайному браузері
Чи це безпечно
Користувачі можуть відмовитися від збору даних для тренування моделей, вимкнувши опцію «покращувати модель для всіх», зазначили в OpenAI. Також можна видалити всі дані браузера і виходити зі всіх сайтів одним кліком у налаштуваннях конфіденційності.
Де він працює
Наразі ШІ-асистент доступний лише для користувачів ChatGPT Pro у США за посиланням. У майбутньому компанія планує розширити доступ для користувачів Plus, Team і Enterprise, а також інтегрувати інструмент у ChatGPT.
Компанія OpenAI відкрила доступ до пошукового сервісу ChatGPT Search для всіх користувачів. Вона додає посилання на джерела відповідно до запиту користувача. Крім того, формулювати запити в пошуковику можна в більш розмовній формі.
Обкладинка й фото: OpenAI
No Comment! Be the first one.