Kể từ khi ra mắt, DALL-E đã có những bước tiến vượt bậc, khẳng định vị thế là một trong những công cụ tạo ảnh bằng trí tuệ nhân tạo hàng đầu. Tuy nhiên, dù mạnh mẽ đến đâu, DALL-E vẫn chưa hoàn hảo và tồn tại nhiều hạn chế nhất định. Những vấn đề này trở nên rõ ràng hơn khi người dùng sử dụng công cụ này thường xuyên, từ sự thiếu nhất quán trong phong cách đến việc gặp khó khăn với kích thước đối tượng. Bài viết này của Thuthuathot.com sẽ đi sâu vào phân tích 9 nhược điểm đáng chú ý của DALL-E mà bạn cần nắm rõ trước khi quyết định sử dụng để tạo ra những tác phẩm nghệ thuật kỹ thuật số của riêng mình.
1. Gặp Khó Khăn Với Văn Bản Trong Hình Ảnh
Dù công nghệ AI đang phát triển nhanh chóng, việc tạo văn bản trong hình ảnh vẫn là một thách thức lớn. Trong số nhiều công cụ tạo ảnh AI hiện nay, DALL-E thường bị đánh giá là một trong những công cụ gặp nhiều vấn đề nhất ở khía cạnh này. Bạn có thể đạt được kết quả tốt hơn với các yêu cầu đơn giản, nhưng ngay cả những yêu cầu tưởng chừng cơ bản cũng có thể khiến DALL-E bộc lộ nhược điểm.
Ví dụ, khi tôi yêu cầu tạo hình ảnh một quán “Café”, phần dấu tiếng Việt đã không được hiển thị chính xác. Trong nhiều thử nghiệm khác, DALL-E cũng thường xuyên đánh vần sai các từ hoặc làm méo mó văn bản, dù tôi đã cung cấp prompt rất rõ ràng và cố gắng sửa lỗi nhiều lần. Bạn cũng sẽ dễ dàng nhận thấy DALL-E không thể tạo ra văn bản dễ đọc cho các biển báo đường phố hay các vật thể tương tự.
Hình ảnh quán cà phê tạo bởi DALL-E với lỗi font chữ và dấu tiếng Việt
2. Không Thay Đổi Kích Thước Ảnh Theo Yêu Cầu
DALL-E thực hiện khá tốt việc tạo ra một hình ảnh dựa trên mô tả, nhưng lại rất kém trong việc điều chỉnh kích thước ảnh khi được yêu cầu. Ví dụ, tôi đã nhiều lần yêu cầu công cụ này thay đổi kích thước ảnh để phù hợp với các blog khác nhau; tuy nhiên, mỗi lần DALL-E chỉ đơn giản là tạo lại một bức ảnh mới thay vì thay đổi kích thước bức ảnh đã có.
May mắn thay, việc cắt và thay đổi kích thước hình ảnh khá đơn giản với nhiều công cụ miễn phí như Canva. Mặc dù vậy, sẽ tiện lợi hơn nhiều nếu DALL-E có thể thực hiện thao tác này mà không cần đến phần mềm bên thứ ba.
3. Khó Tạo Ảnh Chân Thực (Photorealistic)
Mặc dù DALL-E không gặp quá nhiều vấn đề với độ sâu trường ảnh, nhưng công cụ này lại không giỏi trong việc tạo ra các hình ảnh có tính chân thực cao (photorealistic). Chẳng hạn, tôi đã yêu cầu AI tạo một bức ảnh về chó Golden Retriever trong khung cảnh núi non (mà không chỉ định phong cách).
Chó Golden Retriever trong khung cảnh núi non tạo bởi DALL-E, chưa đạt độ chân thực cao
Dù bức ảnh này khá đẹp, nhưng vẫn dễ dàng nhận ra đây là một tác phẩm được tạo bởi AI. Sau đó, tôi yêu cầu DALL-E làm cho nó chân thực hơn. Tuy nhiên, kết quả lại là một bức ảnh trông càng giả tạo hơn, và thành thật mà nói, có phần hơi đáng sợ.
DALL-E cố gắng tạo ảnh chó Golden Retriever siêu thực nhưng bị biến dạng và không tự nhiên
Việc sử dụng các GPT tùy chỉnh (Custom GPT) dành cho ảnh chân thực có thể giúp ích, nhưng bạn cần có gói đăng ký cao cấp để truy cập tính năng này. Nếu không, các công cụ tạo ảnh AI khác như Adobe Firefly thường được khuyến nghị cho ảnh chân thực.
4. Bỏ Qua Các Lệnh Phủ Định Trong Prompt
Một trong những mẹo để viết prompt hiệu quả hơn trong Midjourney, ChatGPT và các công cụ AI khác là chỉ rõ những gì bạn không muốn phần mềm thực hiện. Trong nhiều trường hợp, việc này giúp mang lại kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều lần, tôi đã yêu cầu DALL-E không bao gồm một số yếu tố nhất định trong bức ảnh. Thế nhưng, bất chấp những chỉ dẫn đó, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại ảnh có thể khắc phục được vấn đề, nhưng sẽ tốt hơn nếu không phải thực hiện bước này. Ngược lại, tôi hiếm khi gặp vấn đề này khi sử dụng Adobe Firefly.
5. Thiếu Nhất Quán Trong Một Số Lĩnh Vực
Nhiều công cụ tạo ảnh AI đều có những điểm yếu riêng; ví dụ, một số công cụ tệ trong việc tạo ra hình ảnh bàn tay. DALL-E cũng không ngoại lệ khi thể hiện sự thiếu nhất quán trong nhiều lĩnh vực khác nhau.
Mặc dù DALL-E rất tốt trong việc tạo ra các hình ảnh tổng quát, nhưng nó lại không phải lúc nào cũng giỏi trong việc tạo ra hình ảnh người đang cầm vật thể. Điều kỳ lạ là công cụ này cũng rất kém trong việc tạo ra màn hình máy tính; thường thì nó chỉ tạo ra một đống hình dạng lộn xộn. Yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải luôn luôn) có thể giúp ích.
6. Phong Cách Hình Ảnh Không Đồng Nhất
DALL-E có khả năng tạo ra nhiều loại hình ảnh khác nhau; bạn có thể tạo nghệ thuật AI trông như tranh vẽ, và cũng có thể tạo ra những hình ảnh có vẻ 3D hơn. Tuy nhiên, sự đa dạng này đôi khi dẫn đến các phong cách hình ảnh không nhất quán.
Khi yêu cầu DALL-E tạo một hình ảnh, bạn cần phải cụ thể về những gì bạn muốn. Nếu không, bạn có thể nhận được bất cứ thứ gì. Điều này không phải là vấn đề nếu bạn chỉ đang thử nghiệm ứng dụng, nhưng lại là một nhược điểm nếu bạn muốn có một phong cách nhất quán cho toàn bộ các tác phẩm của mình.
7. Lỗi Kích Thước Vật Thể (Artifact Sizing)
Việc đảm bảo các vật thể trong hình ảnh có tỷ lệ cân đối với thực tế là rất quan trọng nếu bạn quan tâm đến độ chính xác của bức ảnh. Thật không may, DALL-E đôi khi thất bại trong việc tạo ra các vật thể đúng kích thước. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người đang cầm điện thoại trên tay, chiếc điện thoại đôi khi sẽ có kích thước quá lớn.
Ban đầu, tôi nghĩ rằng việc yêu cầu phần mềm tạo ảnh góc rộng hơn sẽ giải quyết được vấn đề. Tuy nhiên, điều này thực sự làm mọi thứ tệ hơn, và người trong ảnh trông càng giả hơn. Thử các prompt chỉnh sửa DALL-E khác nhau có thể hiệu quả với bạn, nhưng tôi vẫn chưa tìm ra giải pháp cho vấn đề này.
Hình ảnh người cầm điện thoại tạo bởi DALL-E với lỗi kích thước vật thể không cân xứng
8. Kém Hiệu Quả Khi Tạo Vật Liệu Bên Ngoài (External Materials)
Ban đầu, tôi nghĩ DALL-E sẽ là một công cụ tuyệt vời để tạo lịch cá nhân, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, tôi nhanh chóng nhận ra rằng phần mềm này không hoạt động tốt trong lĩnh vực này.
Ví dụ, tôi đã thử tạo bìa thiệp sinh nhật bằng DALL-E. Tôi muốn tạo một hình ảnh trong ứng dụng và sau đó tải lên một dịch vụ in ấn. Thật không may, tôi liên tục nhận được một thiết kế mà trong đó có cả một tấm thiệp sinh nhật ngay trong bức ảnh được tạo ra.
DALL-E 3 tạo hình ảnh thiệp sinh nhật lỗi thiết kế và thêm văn bản không mong muốn
Nếu bạn thực sự muốn sử dụng DALL-E cho những thiết kế như vậy, tôi khuyên bạn không nên đề cập rằng bạn sẽ sử dụng nó trên thiệp sinh nhật. Thay vào đó, hãy chỉ định rõ ràng những gì bạn muốn chương trình tạo ra. Sau đó, bạn có thể điều chỉnh kích thước sau. Cách tốt nhất có thể là chỉ tạo hình ảnh trong DALL-E và thêm văn bản bằng một ứng dụng khác.
9. Tạo Ảnh Kém Chất Lượng Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, tôi không biết chính xác thiết kế AI mà mình muốn sử dụng. Trong những trường hợp này, việc nhờ các công cụ tạo ảnh tạo ra nhiều biến thể hình ảnh có thể là một lựa chọn hợp lý. Nhưng theo kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi cung cấp nhiều tùy chọn cho tôi.
Trong nhiều trường hợp, các bức ảnh tôi nhận được thường trông rất giống nhau. Do đó, bạn cần phải cụ thể hơn trong prompt. Tôi cũng nhận thấy rằng việc tạo từng hình ảnh một có hiệu quả hơn là yêu cầu nhiều biến thể cùng lúc.
Mặc dù DALL-E vẫn là một công cụ tạo ảnh AI tuyệt vời và hữu ích, nhưng rõ ràng nó vẫn chưa hoàn hảo và bạn sẽ gặp phải một số vấn đề trong quá trình sử dụng. Điển hình như việc tạo ảnh chân thực kém nếu không dùng Custom GPT, hay việc công cụ thường xuyên bỏ qua các yếu tố mà tôi không muốn có trong bức ảnh. Dù vậy, Thuthuathot.com vẫn khuyến khích bạn nên tự mình trải nghiệm DALL-E để xem những vấn đề này có ảnh hưởng đến quy trình làm việc của bạn hay không.