L'Agent ChatGPT d'OpenAI révolutionne l'automatisation : il contrôle désormais votre ordinateur entier

OpenAI’s new ChatGPT Agent can control an entire computer and do tasks for you

L'Agent ChatGPT d'OpenAI révolutionne l'automatisation : il contrôle désormais votre ordinateur entier

OpenAI franchit une nouvelle étape dans l'intelligence artificielle avec le lancement de ChatGPT Agent, un outil capable d'effectuer des tâches complexes en contrôlant un ordinateur virtuel. Dévoilé jeudi dernier, cet agent combine les fonctionnalités de deux outils existants, Operator et Deep Research, pour automatiser des processus multi-étapes comme la planification de réunions ou les achats en ligne.

Lors d'une démonstration exclusive avec The Verge, les responsables produit Yash Kumar et Isa Fulford ont révélé que ChatGPT Agent s'appuie sur un nouveau modèle spécifiquement développé par OpenAI. Ce système peut accéder à un calendrier pour préparer des réunions clients, organiser un petit-déjeuner familial en achetant les ingrédients nécessaires, ou même créer des présentations après analyse de concurrents.

La technologie sous-jacente, formée par apprentissage par renforcement, intègre plusieurs outils comme des navigateurs texte et visuel, ainsi qu'un terminal pour importer des données personnelles. L'équipe de développement, composée de 20 à 35 membres, a fusionné les équipes d'Operator et Deep Research pour créer cette solution innovante.

Parmi les cas d'usage démontrés, l'agent peut planifier une soirée en consultant Google Calendar et OpenTable, ou générer des rapports de recherche comparant des tendances comme Labubus et Beanie Babies. Fulford souligne son efficacité pour le shopping en ligne, tandis que Kumar l'utilise déjà pour automatiser des tâches administratives comme les demandes de stationnement hebdomadaires.

Malgré des temps de traitement parfois longs (jusqu'à 30 minutes pour certaines tâches), les créateurs mettent en avant le gain de temps global. L'agent demande systématiquement confirmation avant toute action irréversible comme l'envoi d'emails ou des réservations.

OpenAI a activé des protocoles de sécurité renforcés, similaires à ceux d'Anthropic pour Claude Opus 4, bien qu'aucune preuve ne suggère que le modèle puisse faciliter la création d'armes biologiques ou chimiques. Cette prudence reflète les capacités étendues de ce nouvel outil qui marque une avancée significative dans le domaine des agents IA.

ChatGPT Agent của OpenAI: Trợ lý AI mới có thể điều khiển toàn bộ máy tính của bạn

OpenAI vừa công bố ChatGPT Agent - một bước tiến mới trong xu hướng AI agent (trợ lý ảo) có khả năng kiểm soát toàn bộ máy tính ảo để thực hiện các tác vụ phức tạp thay người dùng. Ra mắt vào thứ Năm tuần trước, công cụ này đã được một nhân viên OpenAI sử dụng để tự động hóa việc đăng ký chỗ đỗ xe hàng tuần tại văn phòng San Francisco.

Theo chia sẻ với The Verge từ Yash Kumar (trưởng bộ phận sản phẩm) và Isa Fulford (trưởng nhóm nghiên cứu), ChatGPT Agent được xây dựng trên một mô hình AI mới do OpenAI phát triển riêng. Công cụ này có thể xem lịch để chuẩn bị cho cuộc họp, lên kế hoạch mua nguyên liệu nấu bữa sáng, hay tạo slide thuyết trình sau khi phân tích đối thủ cạnh tranh.

Mô hình đằng sau ChatGPT Agent (chưa có tên chính thức) được đào tạo bằng phương pháp reinforcement learning (học tăng cường) để xử lý các tác vụ đa công cụ như duyệt văn bản, duyệt hình ảnh và terminal nhập liệu. OpenAI cho biết đã kết hợp hai sản phẩm hiện có là Operator và Deep Research để phát triển công cụ mới này.

Nhóm phát triển gồm 20-35 thành viên đã trình diễn nhiều ứng dụng thực tế: từ lên kế hoạch hẹn hò bằng cách kiểm tra Google Calendar và OpenTable, đến tạo báo cáo so sánh xu hướng Labubus và Beanie Babies. Fulford đặc biệt ấn tượng với khả năng mua sắm trực tuyến vượt trội so với khi chỉ dùng Operator.

Kumar tiết lộ anh đã dùng ChatGPT Agent để tự động hóa nhiều việc nhỏ, như đăng ký chỗ đỗ xe mỗi thứ Năm. Khác với các chatbot thông thường chỉ truy cập trình duyệt, công cụ mới này có thể điều khiển 'toàn bộ máy tính' với bộ tính năng mở rộng.

Dù đôi khi chạy chậm (có thể mất 15-30 phút cho các tác vụ phức tạp), nhóm phát triển nhấn mạnh đây vẫn là cải tiến lớn so với thời gian con người cần để hoàn thành. ChatGPT Agent luôn yêu cầu xác nhận trước khi thực hiện hành động không thể đảo ngược như gửi email hay đặt chỗ.

OpenAI đã kích hoạt các biện pháp bảo vệ an ninh tương tự như Anthropic với Claude Opus 4, dù không có bằng chứng cho thấy mô hình này có thể hỗ trợ tạo vũ khí sinh-hóa học. Sự ra đời của ChatGPT Agent đánh dấu bước tiến quan trọng trong cuộc đua phát triển AI agent toàn năng.