OpenAI đã từng hứa hẹn năm 2025 sẽ là một năm đột phá cho sự phát triển của trí tuệ nhân tạo, và sự ra mắt của AI agent đầu tiên mang tên Operator chắc chắn đã hiện thực hóa lời hứa đó. Trợ lý AI tự động này được thiết kế để thực hiện các tác vụ trực tuyến một cách độc lập, đánh dấu sự khởi đầu của thế hệ AI tiếp theo, hứa hẹn thay đổi cách chúng ta tương tác với công nghệ hàng ngày.
OpenAI Operator: Quyền Năng Đặc Quyền Cho Thuê Bao ChatGPT Pro
Trợ lý AI Operator của OpenAI được phát triển với mục tiêu tìm kiếm thông tin trên web và hoàn thành các tác vụ do người dùng giao phó. Nó tích hợp một trình duyệt bên trong, cho phép nó xử lý các công việc như đặt bàn ăn, mua sắm trực tuyến, điền biểu mẫu và nhiều hơn nữa. Để đảm bảo Operator có tính ứng dụng thực tế cao, OpenAI đã và đang hợp tác chặt chẽ với nhiều công ty lớn, bao gồm DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack và Uber.
Một bài đăng trên blog của OpenAI đã mô tả chi tiết cách Operator vận hành:
Operator có khả năng “nhìn” (thông qua ảnh chụp màn hình) và “tương tác” (sử dụng tất cả các hành động mà chuột và bàn phím cho phép) với trình duyệt, cho phép nó thực hiện các tác vụ trên web mà không cần tích hợp API tùy chỉnh.
Nếu gặp phải thử thách hoặc mắc lỗi, Operator có thể tận dụng khả năng suy luận của mình để tự điều chỉnh. Khi bị kẹt và cần hỗ trợ, nó sẽ đơn giản chuyển quyền kiểm soát lại cho người dùng, đảm bảo trải nghiệm liền mạch và có sự hợp tác.
Ngoài các câu lệnh được cài đặt sẵn, người dùng còn có thể thêm các hướng dẫn tùy chỉnh riêng. Đặc biệt, Operator còn có thể chạy nhiều tác vụ đồng thời, tối ưu hóa hiệu suất làm việc.
Giao diện minh họa OpenAI Operator đang hoạt động, một AI agent thực hiện tác vụ tự động trực tuyến.
Tuy nhiên, AI agent này vẫn chưa hoàn hảo. OpenAI thừa nhận rằng Operator hiện gặp vấn đề với các giao diện phức tạp, ví dụ như việc quản lý lịch. Dù vậy, nếu không thể hoàn thành một tác vụ, Operator sẽ “chuyển quyền kiểm soát lại cho người dùng” để bạn tiếp tục xử lý. Điều này có thể gây đôi chút khó chịu ban đầu, nhưng Operator chắc chắn sẽ cải thiện nhanh chóng khi có nhiều người dùng bắt đầu sử dụng và cung cấp dữ liệu.
Tại thời điểm hiện tại, Operator chỉ khả dụng dưới dạng “bản xem trước nghiên cứu” dành riêng cho những người đăng ký gói ChatGPT Pro với mức phí 200 USD mỗi tháng, ra mắt vào tháng 12 năm 2024. Trong tương lai, công cụ này sẽ được mở rộng cho người dùng các gói Plus, Team và Enterprise. Cuối cùng, Operator cũng sẽ được tích hợp trực tiếp vào ChatGPT, hứa hẹn mang lại trải nghiệm liền mạch hơn nữa.
Operator Khơi Mào Thế Hệ AI Tự Động Tiếp Theo
Trong khi ChatGPT và các chatbot khác trước đây thường ở trạng thái thụ động và yêu cầu người dùng phải chủ động dẫn dắt tương tác, Operator đại diện cho một thế hệ AI hoàn toàn mới. Việc đưa trí tuệ nhân tạo vào làm việc để thực hiện các tác vụ trên web có thể làm cho công nghệ này trở nên hữu ích hơn rất nhiều trong cuộc sống hàng ngày. Ví dụ, OpenAI cho biết bạn có thể “chỉ cần mô tả tác vụ bạn muốn thực hiện và Operator sẽ xử lý phần còn lại.” Tuy nhiên, bạn sẽ cần phải có mặt để hoàn tất các khoản thanh toán, giải mã CAPTCHA và các tác vụ tương tự khác yêu cầu sự can thiệp của con người.
OpenAI đang đặt cược rất lớn vào các AI agent. Trong một bài đăng trên blog cuối năm 2024, Giám đốc điều hành Sam Altman đã tuyên bố rằng các AI agent có thể tham gia vào lực lượng lao động vào năm 2025, và sự xuất hiện của Operator là một dấu hiệu rõ ràng cho thấy điều đó đang dần trở thành hiện thực.