ChatGPT dépasse le simple chat : désormais, il travaille pour vous
ChatGPT ne se limite plus aux discussions - il peut désormais effectuer votre travail. Récemment, j'ai évoqué comment les agents IA représentent l'avenir de l'intelligence artificielle : des outils capables d'exécuter des tâches pour vous, comme commander des courses ou planifier des réunions. Le dernier lancement d'OpenAI rapproche cette réalité. Selon un vice-président d'AWS, ces agents IA transformeront le travail et la société à l'échelle d'Internet.
Lors d'un live stream jeudi, OpenAI a présenté un agent ChatGPT capable de gérer des tâches complexes de A à Z. Parmi les exemples : analyser votre agenda pour rédiger un briefing basé sur vos événements à venir, ou même planifier et acheter les ingrédients d'un repas que vous souhaitez cuisiner.
Fonctionnement :
Les fonctionnalités avancées d'OpenAI, notamment Operator et la recherche approfondie, ont offert un aperçu des capacités agentiques de la société et alimentent ce nouveau mode agent. Operator, lancé en janvier, interagit directement avec un navigateur pour effectuer des actions, tandis que la recherche approfondie produit des rapports détaillés en minutes.
OpenAI a combiné ces outils dans cette nouvelle expérience, y ajoutant des fonctionnalités. L'agent ChatGPT utilise un navigateur visuel, un navigateur texte, un terminal et un accès API direct. Il intègre aussi des connecteurs ChatGPT pour lier des applications comme Gmail et GitHub, permettant de récupérer des informations pertinentes.
Grâce à ces sources variées, ChatGPT peut déterminer la meilleure approche pour chaque tâche. Le traitement s'effectue via un ordinateur virtuel, distinguant raisonnement et action selon les instructions humaines, tout en conservant le contexte.
Flexibilité :
L'agent ChatGPT est adaptable. Vous pouvez interrompre une requête pour affiner les instructions, sans perdre le fil des demandes précédentes. Il sollicite aussi des précisions supplémentaires si nécessaire.
Applications :
Les possibilités sont infinies. Automatiser des tâches simples (prendre un rendez-vous) ou complexes (mettre à jour un tableau financier en conservant le formatage). Lors d'une démo, l'agent a recherché des chaussures habillées, créé des goodies à partir d'une photo d'animal, aidé à organiser un mariage et généré des diapositives depuis Google Drive.
À terme, réserver un voyage ou réorganiser un emploi du temps pourrait devenir aussi simple qu'une conversation avec l'IA.
Sécurité :
Un agent IA accédant à vos données personnelles soulève des questions. OpenAI aborde ces préoccupations dans un volet dédié de son article, en plus de la fiche modèle habituelle. Des garde-fous ont été mis en place pour les défis identifiés.
ChatGPT không chỉ để trò chuyện - giờ đây nó sẽ làm việc thay bạn
ChatGPT không còn dừng lại ở chức năng trò chuyện - giờ đây nó có thể thực hiện công việc thay bạn. Cách đây không lâu, tôi đã nhận định rằng các tác nhân AI chính là tương lai của trí tuệ nhân tạo: những công cụ có thể thay bạn thực hiện các nhiệm vụ như đặt hàng tạp hóa hay sắp xếp cuộc họp. Bản cập nhật mới nhất từ OpenAI đang biến điều đó thành hiện thực gần hơn bao giờ hết. Một phó chủ tịch AWS cũng khẳng định: các tác nhân AI sẽ thay đổi xã hội và cách làm việc với quy mô tương đương sự phát triển của Internet.
Trong buổi phát trực tiếp vào thứ Năm, OpenAI đã trình làng tác nhân ChatGPT - được công ty mô tả có khả năng xử lý các nhiệm vụ phức tạp từ đầu đến cuối. Các ví dụ minh họa bao gồm: phân tích lịch trình để viết báo cáo dựa trên các sự kiện sắp tới, hay thậm chí lên kế hoạch và mua nguyên liệu cho bữa ăn bạn dự định nấu.
Cách hoạt động:
Những tính năng tiên tiến nhất của OpenAI gồm Operator và nghiên cứu chuyên sâu đã cho công chúng cái nhìn về khả năng tác nhân của công ty, và nay làm nền tảng cho chế độ tác nhân mới này. Operator ra mắt tháng 1/2024, được thiết kế để tương tác trực tiếp với trình duyệt web thực thi hành động, trong khi nghiên cứu chuyên sâu có thể lập báo cáo chi tiết chỉ trong vài phút - việc mà con người cần hàng giờ.
Nhận thấy nhiều truy vấn phù hợp với Nghiên cứu chuyên sâu hơn là Operator, OpenAI quyết định kết hợp cả hai trong trải nghiệm mới, đồng thời bổ sung thêm công cụ. Tác nhân ChatGPT sử dụng trình duyệt đồ họa (GUI), trình duyệt văn bản, terminal và truy cập API trực tiếp. Nó còn tích hợp bộ kết nối ChatGPT, cho phép liên kết với các ứng dụng như Gmail và GitHub để thu thập dữ liệu phục vụ yêu cầu.
Với đa dạng nguồn thông tin, ChatGPT có khả năng lập luận để chọn phương án tối ưu cho từng tác vụ. Quá trình xử lý diễn ra trên máy tính ảo riêng, phân biệt rõ giữa lập luận và hành động dựa trên chỉ dẫn con người, đồng thời duy trì ngữ cảnh khi sử dụng đa công cụ.
Linh hoạt và điều hướng được:
Tác nhân ChatGPT cho phép bạn tạm dừng yêu cầu giữa chừng để điều chỉnh hướng dẫn nhằm đạt kết quả mong muốn hơn. Nó không quên các chỉ dẫn cũ dù tiếp nhận thông tin mới, đồng thời biết yêu cầu làm rõ chi tiết khi cần thiết.
Ứng dụng thực tế:
Khả năng ứng dụng là vô hạn. Từ việc tự động hóa tác vụ đơn giản như đặt lịch hẹn tiệm làm tóc, đến phức tạp như cập nhật bảng tính tài chính mà vẫn giữ nguyên định dạng. Trong bản demo, tác nhân đã tìm giày công sở cỡ 9.5, tạo sản phẩm in hình thú cưng, hỗ trợ kế hoạch cưới và làm slide từ Google Drive.
Trong tương lai, việc nhờ AI đặt chuyến du lịch hay sắp xếp lại lịch họp có thể trở nên đơn giản như trò chuyện tự nhiên.
Bảo mật và quyền riêng tư:
Một AI có quyền truy cập thông tin cá nhân và hành động thay bạn đương nhiên dấy lên lo ngại. OpenAI giải quyết thẳng thắn vấn đề này qua một trang riêng trong bài đăng, bên cạnh thẻ mô hình thông thường. Công ty cho biết đã bổ sung các biện pháp bảo vệ cho những rủi ro đã được phát hiện.