Máy Tính

ChatGPT Nâng Cấp Khả Năng Tạo Ảnh Với GPT-4o: Bước Tiến Vượt Trội Của AI

Hình ảnh người đàn ông tóc trắng với sẹo, phong cách thợ săn quái vật, mua sắm trong siêu thị hiện đại do DALL-E tạo ra

Bản cập nhật mới nhất của OpenAI dành cho ChatGPT mang đến một bước tiến đột phá, nâng cấp đáng kể khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, người dùng có thể tạo ra những hình ảnh chất lượng cực cao trực tiếp bằng GPT-4o mà không cần chuyển sang DALL-E 3 hoặc bắt đầu một cuộc trò chuyện mới. Đây là một cải tiến đáng giá, định hình lại cách chúng ta tương tác với AI trong lĩnh vực đồ họa. Tuy nhiên, hiện tại vẫn có một số hạn chế nhất định đối với người dùng ChatGPT miễn phí.

GPT-4o: Cuộc Cách Mạng Về Tạo Hình Ảnh và Chỉnh Sửa

Mô hình GPT-4o của OpenAI đã trở thành lựa chọn mặc định cho hầu hết các cuộc hội thoại trên ChatGPT, được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi” nhờ tốc độ và độ chính xác vượt trội trong việc xử lý văn bản. Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o nay còn có thể tạo hình ảnh chất lượng cao với độ chi tiết kinh ngạc, vượt xa chất lượng của mô hình tiền nhiệm mà nó thay thế, DALL-E 3.

Không chỉ dừng lại ở việc tạo hình ảnh, GPT-4o còn sở hữu khả năng chỉnh sửa và điều chỉnh hình ảnh vượt trội hơn nhiều so với DALL-E 3. Các thao tác như chỉnh sửa ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế các chi tiết, thêm hoặc bớt đối tượng ở tiền cảnh và hậu cảnh, và nhiều tính năng khác đều có thể thực hiện được một cách linh hoạt và chính xác. Sự cải tiến này mở ra cánh cửa cho việc sáng tạo nội dung trực quan phức tạp và chuyên nghiệp hơn ngay trong môi trường ChatGPT.

Hình ảnh người đàn ông tóc trắng với sẹo, phong cách thợ săn quái vật, mua sắm trong siêu thị hiện đại do DALL-E tạo raHình ảnh người đàn ông tóc trắng với sẹo, phong cách thợ săn quái vật, mua sắm trong siêu thị hiện đại do DALL-E tạo ra

Hình ảnh người đàn ông tóc trắng với sẹo, phong cách thợ săn quái vật, mua sắm trong siêu thị hiện đại được tạo bằng GPT-4o, cho thấy cải thiện chi tiếtHình ảnh người đàn ông tóc trắng với sẹo, phong cách thợ săn quái vật, mua sắm trong siêu thị hiện đại được tạo bằng GPT-4o, cho thấy cải thiện chi tiết

Cải Thiện Đáng Kể Khả Năng Tạo Văn Bản Trong Hình Ảnh

Một trong những điểm yếu cố hữu của nhiều mô hình AI tạo hình ảnh là khả năng tích hợp văn bản. DALL-E 3 dù đã có tiến bộ nhưng vẫn chưa thực sự hoàn hảo trong việc tạo ra văn bản rõ ràng và chính xác trong hình ảnh. Với GPT-4o, khả năng tạo văn bản trong hình ảnh đã được cải thiện một cách ấn tượng. Giờ đây, mô hình có thể tạo ra các infographics chi tiết với giải thích rõ ràng về hầu hết mọi chủ đề. Vị trí văn bản trong hình ảnh trở nên chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo gặp phải tình trạng văn bản bị mờ hay méo mó.

Khả năng giữ lại chi tiết cũng là một cải tiến rõ rệt khác. Các đặc điểm cụ thể giờ đây dễ dàng được chuyển từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn bối cảnh hoặc tạo ra một hình ảnh hoàn toàn mới, đảm bảo tính nhất quán trong các chuỗi sáng tạo.

Bí Quyết Đằng Sau Sự Vượt Trội Của GPT-4o

Một phần của chất lượng hình ảnh được nâng cấp đến từ sự hợp tác của OpenAI với các công ty lớn như Shutterstock, cùng với đội ngũ các chuyên gia đã dành nhiều giờ để xác định và tinh chỉnh các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường (reinforcement learning) này cho phép GPT-4o làm theo hướng dẫn của con người một cách chính xác trong một loạt các yêu cầu tạo hình ảnh, và quá trình này chỉ cần “hơn 100 nhân viên con người” để hoàn thành.

Người đàn ông giống Einstein đang ăn kem tại công viên Central Park do DALL-E tạo ra, minh họa khả năng tạo hình ảnh trước đâyNgười đàn ông giống Einstein đang ăn kem tại công viên Central Park do DALL-E tạo ra, minh họa khả năng tạo hình ảnh trước đây

Người đàn ông giống Einstein đang ăn kem tại công viên Central Park được tạo bằng GPT-4o, thể hiện sự nâng cấp về độ chi tiết và chất lượng hình ảnhNgười đàn ông giống Einstein đang ăn kem tại công viên Central Park được tạo bằng GPT-4o, thể hiện sự nâng cấp về độ chi tiết và chất lượng hình ảnh

Ai Được Trải Nghiệm Tính Năng Tạo Ảnh Mới Của ChatGPT?

Mặc dù khả năng tạo ảnh mới của ChatGPT thực sự ấn tượng và được khuyến khích mọi người trải nghiệm, nhưng nó vẫn chưa hoàn hảo—giống như bất kỳ công cụ AI tạo hình ảnh nào khác. Dù vậy, đây là một bước nhảy vọt đáng kể về chất lượng so với DALL-E 3, vốn hữu ích nhưng chưa thực sự vượt trội.

Đáng tiếc là do nhu cầu sử dụng GPT-4o quá lớn, người dùng ChatGPT miễn phí một lần nữa phải chờ đợi để được trải nghiệm tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO OpenAI, Sam Altman, đã xác nhận sự chậm trễ này mà không đưa ra khoảng thời gian cụ thể cho việc triển khai rộng rãi. Lượng quan tâm tăng vọt là điều được dự kiến, nhưng quy mô lại vượt xa tưởng tượng. Điều này đồng nghĩa với việc bạn sẽ phải chờ đợi thêm một thời gian hoặc cân nhắc nâng cấp lên ChatGPT Plus với mức phí 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp đột phá như thế này, việc nâng cấp lên ChatGPT Plus ngày càng trở nên xứng đáng.

Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo hình ảnh cũ của OpenAI” (legacy image generation model). Điều này ngụ ý rằng OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện chưa có mốc thời gian cụ thể cho sự thay đổi này.

Cập nhật mới nhất của ChatGPT với khả năng tạo ảnh từ GPT-4o đã đánh dấu một cột mốc quan trọng trong sự phát triển của trí tuệ nhân tạo tạo sinh (generative AI). Với những cải tiến vượt bậc về chất lượng, độ chi tiết và khả năng chỉnh sửa, GPT-4o không chỉ nâng cao trải nghiệm người dùng mà còn mở ra nhiều tiềm năng ứng dụng mới trong các lĩnh vực sáng tạo nội dung, thiết kế và hơn thế nữa. Hãy theo dõi diemhencongnghe.com để không bỏ lỡ những thông tin cập nhật công nghệ mới nhất về AI và khám phá cách AI đang thay đổi thế giới xung quanh chúng ta!

Related Articles

Ente Photos: Giải Pháp Lưu Trữ Ảnh Riêng Tư, Bảo Mật Vượt Trội Cho Người Dùng Việt

Administrator

Tối Ưu Năng Suất: 5 Mẹo Biến Windows Sticky Notes Thành Công Cụ Quản Lý Mạnh Mẽ

Administrator

Đánh Giá Sâu Rộng Google Gemini 2.5 Pro: Sức Mạnh Suy Luận Đỉnh Cao Của AI

Administrator

Leave a Comment