Ra mắt mô hình mới nhưng bị chê cười là dấu hiệu của sự phá sản! Mô hình “mạnh nhất” của Stability AI trong việc vẽ hình người quá “thảm hại”, người dùng mạng: Do nghiên cứu phát triển quá nghiêm khắc.
Stability AI ra mắt Stable Diffusion 3 Medium: Một bước tiến quan trọng trong lĩnh vực AI

Vào ngày 12 tháng 6, Stability AI đã công bố Stable Diffusion 3 Medium, một mô hình mở tiên tiến nhất cho đến nay trong việc chuyển đổi văn bản thành hình ảnh. Công ty khởi nghiệp Anh quốc này tuyên bố rằng mô hình này có thể tạo ra các hình ảnh này trên các hệ thống tiêu dùng như máy tính cá nhân và máy tính xách tay, cũng như trên các máy chủ doanh nghiệp sử dụng GPU.
Để trải nghiệm SD3 Medium, bạn có thể sử dụng API trên nền tảng Stability (https://platform.stability.ai/) hoặc đăng ký Stable Assistant (https://stability.ai/stable-assistant) để thử miễn phí trong ba ngày. Hoặc bạn cũng có thể thử qua Stable Artisan trên Discord (https://stability.ai/stable-artisan).
SD3 Medium bao gồm 2 tỷ tham số, không cần quy trình phức tạp để tạo ra kết quả chân thực. Đặc biệt, kích thước của mô hình này nhỏ hơn nhiều so với nhiều mô hình Stable Diffusion 3 khác, những mô hình này có từ 800 triệu đến 8 tỷ tham số.
Stability cho biết, họ đã xây dựng SD3 Medium để hiểu các gợi ý phức tạp liên quan đến mối quan hệ không gian, yếu tố cấu trúc, hành động và phong cách. Tuy nhiên, khi được ra mắt, mô hình này đã gặp phải sự chế nhạo vì vẽ các bộ phận cơ thể con người như tay và chân một cách kỳ quái.
Một số người dùng thậm chí còn phàn nàn rằng “phiên bản này có vẻ như chỉ để đùa cợt.” Mặc dù vậy, Stability AI vẫn nhấn mạnh rằng SD3 Medium là một mô hình SD3 có 2 tỷ tham số, nổi bật với chất lượng tổng thể xuất sắc và độ chân thực như ảnh chụp, khả năng hiểu các gợi ý phức tạp và hiệu suất tài nguyên tốt.
Stability cũng đã hợp tác với NVIDIA và AMD để cải thiện hiệu suất của tất cả các mô hình Stable Diffusion, bao gồm cả SD3 Medium. Họ cũng đang tuân thủ các nguyên tắc thực hành AI an toàn và có trách nhiệm, và đã triển khai nhiều biện pháp bảo vệ nhằm ngăn chặn việc lạm dụng mô hình này.
Tuy nhiên, sự ra mắt của SD3 Medium đã nhanh chóng trở thành chủ đề chế nhạo trên mạng do khả năng tạo ra hình ảnh con người kém hơn so với các mô hình tổng hợp hình ảnh tiên tiến khác như Midjourney và DALL-E 3. Các hình ảnh được tạo bởi SD3 Medium thường có những cấu trúc kỳ dị và méo mó.
Điều này có thể do ảnh hưởng của tập dữ liệu huấn luyện chất lượng thấp, dẫn đến việc vẽ tay luôn là một thách thức đối với các công cụ tạo hình ảnh AI. Tuy nhiên, gần đây, nhiều mô hình tổng hợp hình ảnh dường như đã vượt qua được vấn đề này.
Một số người dùng Reddit đã chỉ ra rằng SD3 Medium dường như đang thụt lùi so với phiên bản SD XL Turbo được phát hành vào tháng 11 năm ngoái. Điều này có thể do quy trình kiểm duyệt nghiêm ngặt đối với nội dung không phù hợp với công việc (NSFW), khiến mô hình không thể học hỏi đầy đủ về giải phẫu cơ thể con người.
Ngoài ra, các nhà nghiên cứu cũng nhận thấy rằng bộ lọc NSFW quá nhạy cảm có thể loại bỏ không chỉ nội dung khiêu dâm mà còn cả các hình ảnh không gây phản cảm khác, điều này có thể dẫn đến việc mô hình không thể tạo ra hình ảnh con người chính xác.
Mặc dù vậy, Stability AI vẫn khẳng định rằng họ sẽ tiếp tục cải tiến mô hình SD3 Medium dựa trên phản hồi của người dùng, đồng thời mở rộng chức năng và tối ưu hóa hiệu suất. Mục tiêu của họ là đặt ra một chuẩn mực mới trong lĩnh vực sáng tạo nghệ thuật bằng AI và biến SD3 Medium thành một công cụ quan trọng cho cả chuyên gia và người yêu thích.

Từ khóa:
AI, Stability AI, Stable Diffusion 3 Medium, Mô hình AI, Công nghệ AI
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...