Bản cập nhật ChatGPT mới nhất của OpenAI đã mang đến một bước tiến vượt bậc cho khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, người dùng có thể tạo ra những hình ảnh chất lượng cực kỳ cao ngay trong cuộc trò chuyện mà không cần phải chuyển sang DALL-E 3. Tuy nhiên, có một lưu ý nhỏ dành cho người dùng ChatGPT miễn phí – ít nhất là ở thời điểm hiện tại.
GPT-4o: Bước Nhảy Vọt Về Khả Năng Tạo Hình Ảnh
Mô hình GPT-4o của OpenAI hiện là lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT, được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi” nhờ khả năng xử lý thông tin đa dạng, tốc độ nhanh và độ chính xác cao đối với văn bản. Tuy nhiên, kể từ bản cập nhật ngày 25 tháng 3 năm 2025, GPT-4o đã được nâng cấp mạnh mẽ để vượt trội hơn trong lĩnh vực tạo hình ảnh.
Mô hình này không chỉ có thể tạo ra những hình ảnh chất lượng cao với chi tiết đáng kinh ngạc, mà còn vượt xa mô hình tiền nhiệm là DALL-E 3. Hơn thế nữa, GPT-4o giờ đây có thể thực hiện chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3, bao gồm chỉnh sửa chi tiết, điều chỉnh màu sắc và phong cách, thay đổi tinh tế các đối tượng tiền cảnh và hậu cảnh, cùng nhiều tùy chọn khác.
Người đàn ông thợ săn quái vật râu trắng, sẹo trên mặt, đang mua sắm tại siêu thị hiện đại, được tạo bởi DALL-E 3.
Phiên bản nâng cấp hình ảnh của thợ săn quái vật râu trắng tại siêu thị, thể hiện khả năng tạo ảnh chi tiết của GPT-4o.
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện đáng kể. Trong khi việc tạo văn bản của DALL-E 3 chưa bao giờ là điểm mạnh (và đây cũng là một điểm yếu chung của nhiều mô hình AI), GPT-4o giờ đây có thể tạo ra các biểu đồ thông tin chi tiết với giải thích rõ ràng về hầu hết mọi chủ đề. Vị trí văn bản trong hình ảnh trở nên chính xác, với các kiểu chữ và hướng cụ thể mà không còn nguy cơ tạo ra những hình ảnh mờ nhòe. Việc duy trì chi tiết cũng là một cải tiến rõ rệt khác, với các đặc điểm cụ thể dễ dàng được truyền từ hình ảnh này sang hình ảnh khác mà không làm ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Hình ảnh người đàn ông giống Einstein ăn kem tại Công viên Trung tâm, được tạo bởi DALL-E 3 với độ chi tiết trung bình.
Einstein phiên bản AI đang thưởng thức kem ở Central Park, minh họa khả năng tạo ảnh chân thực của mô hình GPT-4o.
Một phần của việc nâng cấp chất lượng hình ảnh này đến từ các mối quan hệ đối tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một loạt lớn các yêu cầu tạo hình ảnh, và chỉ cần “hơn 100 nhân viên” để hoàn thành quy trình này. Khả năng tạo hình ảnh mới của ChatGPT thực sự đáng kinh ngạc, và rất đáng để trải nghiệm. Mặc dù chưa hoàn hảo, nhưng đây là một bước nhảy vọt đáng kể về chất lượng so với các mô hình tạo ảnh AI trước đây như DALL-E 3.
Cập Nhật Ảnh GPT-4o Và Tình Hình Triển Khai Cho Người Dùng
Đáng tiếc, do nhu cầu sử dụng GPT-4o chưa từng có, người dùng miễn phí của ChatGPT một lần nữa phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO OpenAI Sam Altman đã xác nhận sự chậm trễ này mà không đưa ra một khung thời gian cụ thể cho việc kết thúc.
Sự gia tăng đột biến về số lượng người dùng được dự đoán từ trước, nhưng không đến mức lớn như thực tế. Điều này có nghĩa là bạn sẽ phải đợi thêm một thời gian nữa hoặc nâng cấp lên ChatGPT Plus với 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp ấn tượng như thế này, việc nâng cấp lên ChatGPT Plus ngày càng trở nên đáng giá.
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo hình ảnh cũ của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có thời gian cụ thể cho sự thay đổi này.
Với những cải tiến vượt bậc về tạo hình ảnh và văn bản, GPT-4o hứa hẹn sẽ mở ra nhiều ứng dụng sáng tạo mới. Hãy trải nghiệm ChatGPT Plus ngay hôm nay để khám phá toàn bộ tiềm năng của mô hình này và tạo ra những hình ảnh độc đáo theo ý muốn của bạn.