ChatGPT đang nhận được một bản nâng cấp “khủng” được thiết kế để tăng tốc cuộc sống của bạn và loại bỏ các tác vụ lặp đi lặp lại, nhàm chán, vốn thường làm chúng ta xao nhãng khỏi công việc, giải trí và nhiều hơn nữa. Tính năng mới ChatGPT Agent của OpenAI sẽ ra mắt khả năng duyệt web tự động hoàn toàn (agentic browsing) và nó sẽ sớm đến tay người dùng. Đây là một bước tiến đột phá, hứa hẹn thay đổi cách chúng ta tương tác với công nghệ.
ChatGPT Agent: Bước Tiến Vượt Bậc Về Khả Năng Tự Động Hóa AI
ChatGPT đang dần có khả năng sử dụng các tác nhân AI tự động hoàn toàn, được gọi là ChatGPT Agent. Hãy hình dung thế này: Cho đến nay, ChatGPT có thể duyệt web và tìm thông tin cho bạn, nhưng bạn vẫn cần phải duy trì sự tương tác và hướng dẫn quá trình nghiên cứu của nó.
ChatGPT Agent lựa chọn và tương tác tự động trong giao diện chat
Tuy nhiên, giờ đây ChatGPT Agent có thể tự động hóa hoàn toàn tất cả các quy trình, yêu cầu và tác vụ này, hoàn thành chúng với gần như không cần sự can thiệp từ người dùng. Về nhiều mặt, ChatGPT Agent kết hợp hai công cụ trước đây của OpenAI là Operator và Deep Research, để tạo ra một công cụ mạnh mẽ hơn đáng kể, có khả năng tự chủ hoàn thành các hành động. Operator là nỗ lực trước đây của OpenAI về một tác nhân AI, có thể duyệt web, đặt lịch và hoàn thành một số tác vụ cơ bản. Trong khi đó, Deep Research là một công cụ nghiên cứu chuyên sâu, được thiết kế để đi sâu vào bất kỳ yêu cầu nào, tạo ra các báo cáo toàn diện với phân tích dữ liệu từ nhiều nguồn, nhưng nó không được thiết kế cho mức độ tương tác web như Operator.
Kết hợp các công cụ này với sức mạnh của AI tự chủ (agentic AI) mang đến một công cụ có thể duyệt web hoàn toàn cho bạn, tính đến gần như mọi thông tin bạn cung cấp. Theo đó, ChatGPT Agent có thể truy cập “ChatGPT connectors”, cho phép bạn liên kết các ứng dụng và tài khoản với tác nhân, nơi nó có thể tìm thấy thông tin rất cụ thể về bạn và yêu cầu của bạn. Ví dụ: bạn có thể kết nối Gmail, ứng dụng lịch của mình và các ứng dụng khác, biến AI tự chủ này thành một trợ lý cá nhân thực thụ.
ChatGPT Agent của OpenAI đang tự động duyệt web và thu thập thông tin
Bạn có thể chia nhỏ sức mạnh của ChatGPT Agent thành ba lĩnh vực chính:
Ba Trụ Cột Sức Mạnh của ChatGPT Agent
- Tác vụ Tự động Hoàn toàn: ChatGPT Agent có thể hoàn thành các tác vụ phức tạp, đa bước mà không yêu cầu người dùng nhập liệu liên tục.
- Duyệt web Thông minh: Tác nhân có thể duyệt web trong ChatGPT, mô phỏng chính xác hành vi của một người thật với các cú nhấp chuột và thao tác của nó. Nó cũng có thể điều hướng các biểu mẫu, điều này cực kỳ quan trọng trong môi trường internet hiện nay. Đây là một máy tính ảo trong ChatGPT, có cả giao diện văn bản và trình duyệt trực quan mà Agent có thể chọn sử dụng.
- Kho Công cụ Đa năng: OpenAI đã xác nhận rằng ChatGPT Agent có thể sử dụng tất cả các công cụ đã có sẵn để hoàn thành các tác vụ của mình, chẳng hạn như truy cập API, thao tác tệp, nhập dữ liệu, lập luận và thậm chí là viết mã để hoàn thành công việc. Ví dụ, Agent có quyền truy cập vào thiết bị đầu cuối riêng để thực hiện các tác vụ cụ thể hoặc sử dụng AI tạo sinh để tạo ra hình ảnh độc đáo.
ChatGPT Agent sử dụng tính năng kết nối (connector) để liên kết ứng dụng và tài khoản
Đây là mô hình đầu tiên mà OpenAI đã đào tạo có thể di chuyển liền mạch giữa các chức năng khác nhau và “hộp công cụ hợp nhất”. Sử dụng học tăng cường (reinforcement learning), Agent có thể quyết định khi nào sử dụng bất kỳ công cụ nào có sẵn, cho phép nó xử lý các yêu cầu và tác vụ phức tạp từng bước một. Theo thời gian, nó sẽ trở nên hiệu quả hơn trong việc hoàn thành tác vụ, tăng tốc quá trình và nâng cao độ chính xác.
Bảo Mật và An Toàn Của ChatGPT Agent: Điều Gì Bạn Cần Biết?
Trong buổi phát trực tiếp của OpenAI, một số tính năng bảo mật chính được tích hợp trong ChatGPT Agent đã được làm nổi bật.
Thứ nhất, mặc dù nó có thể hoàn thành các tác vụ theo yêu cầu, nhưng nó sẽ nhắc bạn khi đến lúc gửi biểu mẫu, đăng nhập vào trang web và các tác vụ quan trọng khác. Các điểm dừng này được thiết kế để ngăn chặn các vấn đề phát sinh cụ thể trong những tình huống này. Tự động hóa rất tuyệt vời, nhưng hiện tại, sự can thiệp của người dùng vẫn rất quan trọng.
OpenAI cũng đã đào tạo Agent từ chối các yêu cầu nguy hiểm, không an toàn hoặc mơ hồ mà nó không thể thực hiện. Nó được liên kết chặt chẽ với các tiêu chuẩn an toàn hiện có của OpenAI, đảm bảo rằng nó không đi chệch quá xa khỏi các giới hạn hiện tại của ChatGPT. Điều này chắc chắn sẽ làm một số người cảm thấy khó chịu khi tin rằng ChatGPT đã bị khóa quá chặt, nhưng nó hoàn toàn hợp lý khi triển khai các tác nhân AI tự động ra thế giới. Hơn nữa, tại thời điểm ra mắt, nó cũng sẽ không thực hiện bất kỳ giao dịch mua nào mà không có xác nhận.
Agent cũng đi kèm với một số công cụ mới để bảo vệ chống lại tấn công prompt injection, một loại tấn công độc hại mới tập trung vào các công cụ AI. Prompt injection là một vấn đề đối với tất cả các loại AI tạo sinh, nhưng nó đặc biệt đáng lo ngại khi các công cụ này sẽ bắt đầu duyệt web tự động.
Theo đó, OpenAI đã xây dựng một số biện pháp bảo vệ mới trong Agent. Ví dụ, ChatGPT Agent chạy trong một môi trường sandboxed (cách ly). Mặc dù nó có thể thực hiện thay đổi trên lịch của bạn, tải xuống tệp, v.v., OpenAI không muốn nó tương tác trực tiếp với hệ điều hành của bạn ở mức độ có thể gây hại, vì vậy nó cô lập công cụ này. Ngoài ra, nó sử dụng các bộ phân loại cụ thể để xác định các cuộc tấn công prompt injection và các loại thao túng khác, đồng thời được thiết kế để ngăn chặn chúng.
Khi Nào ChatGPT Agent Chính Thức Đến Tay Người Dùng?
Thực tế, trong một khoảnh khắc hiếm hoi của OpenAI, Sam Altman đã xác nhận rằng Agent sẽ ra mắt ngay lập tức. Người dùng đăng ký ChatGPT Pro sẽ nhận được 400 yêu cầu mỗi tháng, trong khi người đăng ký Plus và Team có giới hạn hơn là 40 yêu cầu.
Tuy nhiên, giống như hầu hết các tính năng mới của ChatGPT, ngay cả khi được ra mắt ngay lập tức, nó vẫn cần vài ngày để triển khai đến tài khoản cụ thể của bạn, ngay cả khi bạn đã đăng ký một trong các gói nêu trên.
Đừng quên, lĩnh vực duyệt web tự động hóa với AI (agentic browsing) đang rất sôi động. Đầu năm 2025, Opera đã ra mắt trình duyệt AI agentic ấn tượng của mình là Neon, trong khi Perplexity cũng đang thử nghiệm trình duyệt AI-powered Comet của mình. Và đó là chưa kể đến gã khổng lồ chống virus Norton cũng sẽ ra mắt Neo, một trình duyệt AI-powered khác, vào khoảng năm 2025. Như đã nói, các trình duyệt được hỗ trợ bởi AI đã ở đây, và chúng đang đến rất nhiều!
ChatGPT Agent đánh dấu một bước nhảy vọt quan trọng trong việc tự động hóa các tác vụ trực tuyến, biến trải nghiệm công nghệ của bạn trở nên liền mạch và hiệu quả hơn bao giờ hết. Với khả năng duyệt web thông minh, kho công cụ đa dạng và các tính năng bảo mật nâng cao, OpenAI đang định hình lại tương lai của trợ lý AI. Hãy sẵn sàng khám phá và tận dụng tối đa những gì ChatGPT Agent mang lại để nâng cao năng suất cá nhân và công việc của bạn. Đừng quên theo dõi thuthuathot.com để cập nhật những tin tức và đánh giá chi tiết nhất về công nghệ AI!