Đại học Hong Kong và Sima hợp tác phát hành: Tập dữ liệu Defect Spectrum định nghĩa lại kiểm tra chất lượng công nghiệp AI.

Trong chuỗi đóng kín của sản xuất thông minh từ “sản xuất – phát hiện lỗi – tối ưu hóa quy trình – sản xuất”, việc phát hiện lỗi thông minh dựa trên AI đóng vai trò là người kiểm soát. Tuy nhiên, từ trước đến nay, người kiểm soát này lại thiếu dữ liệu lỗi lớn, chính xác và mang nhiều ngữ nghĩa.
Gần đây, Đại học Khoa học và Công nghệ Hồng Kông (HKUST) và công ty unicorn AI chuyên về sản xuất thông minh Samaiku đã cùng công bố một bài báo nghiên cứu. Bài báo này giới thiệu bộ dữ liệu Defect Spectrum và mô hình tạo ra lỗi DefectGen, tập trung vào việc phát hiện lỗi thông minh trong công nghiệp, có thể giải quyết vấn đề không nhận dạng được các loại lỗi và vị trí của chúng, nâng cao 10.74% tỷ lệ phát hiện và giảm 33.1% tỷ lệ phát hiện sai.
Theo thông tin, nhóm hợp tác này đã đưa ra bài báo “Ref-NeuS: Học bề mặt ẩn giảm mờ cho tái tạo đa góc nhìn với phản xạ” vào năm ngoái và được chọn làm ứng cử viên cho bài báo tốt nhất tại Hội nghị IEEE về Xử lý Hình ảnh và Máy tính (ICCV).
Dữ liệu chất lượng cao đóng vai trò quan trọng đối với sự phát triển của kỹ thuật thị giác máy tính và AI. Ví dụ như bộ dữ liệu ImageNet đã không chỉ thúc đẩy sự đổi mới của thuật toán mà còn thúc đẩy sự phát triển và tiến bộ của ngành công nghiệp.
Trong lĩnh vực công nghiệp, các bộ dữ liệu như MVTec, VISION VI, DAGM2007 đã giúp các thuật toán học máy thị giác tiếp cận gần hơn với thực tế sản xuất, nhưng do số lượng mẫu, độ chính xác và mô tả ngữ nghĩa không đầy đủ, chúng vẫn đang hạn chế sự phát triển của AI trong việc phát hiện lỗi công nghiệp.
Defect Spectrum mang nhiệm vụ vượt qua ranh giới truyền thống của việc phát hiện lỗi công nghiệp, cung cấp một lượng lớn dữ liệu lỗi được đánh dấu chi tiết, lần đầu tiên đạt được độ chính xác cao và ngữ nghĩa phong phú trong việc phát hiện lỗi công nghiệp.
So với các bộ dữ liệu công nghiệp khác, bộ dữ liệu “Defect Spectrum” cung cấp 5.438 mẫu lỗi, 125 loại lỗi và cung cấp nhãn pixel chi tiết, cung cấp mô tả ngôn ngữ chi tiết cho mỗi mẫu lỗi, đạt được sự đột phá chưa từng có về hiệu suất.

So với các bộ dữ liệu công nghiệp khác, Defect Spectrum có độ chính xác cao hơn và nhãn phong phú hơn.

Đối sánh số lượng và đặc điểm giữa Defect Spectrum và các bộ dữ liệu khác
Từ góc độ sản xuất công nghiệp thực tế, nhà máy yêu cầu phát hiện lỗi chi tiết, cần kiểm soát lỗi đồng thời đảm bảo lợi nhuận. Tuy nhiên, các bộ dữ liệu phát hiện lỗi hiện tại thường thiếu độ chính xác và ngữ nghĩa phong phú cần thiết cho ứng dụng, không thể hỗ trợ tốt cho sản xuất thực tế.
Ví dụ, nếu răng kéo của một chiếc áo bị dịch chuyển, mặc dù kích thước lỗi không lớn nhưng nó ảnh hưởng đến chức năng của áo, khiến kéo không thể sử dụng. Kết quả, khách hàng phải trả lại áo để sửa chữa. Tuy nhiên, nếu lỗi xảy ra ở vải của áo, ví dụ như gai nhỏ hoặc màu sắc có chút khác biệt, thì cần cân nhắc kỹ lưỡng kích thước và ảnh hưởng của nó. Lỗi vải nhỏ có thể được phân loại trong phạm vi chấp nhận được, cho phép các sản phẩm này được bán thông qua các chiến lược phân phối khác nhau, ví dụ như bán với giá giảm, để duy trì lợi nhuận mà không ảnh hưởng đến chất lượng tổng thể.
Các bộ dữ liệu truyền thống như MVTec và AeBAD, mặc dù cung cấp nhãn pixel, nhưng thường giới hạn ở mặt nạ nhị phân, không thể phân biệt chi tiết các loại lỗi và vị trí. Bộ dữ liệu Defect Spectrum thông qua việc hợp tác với bốn chuẩn mực công nghiệp, đánh giá lại và tinh chỉnh các nhãn lỗi đã có, vẽ lại các đường viền của các vết xước và hố nhỏ hơn một cách chính xác hơn, và điền vào các lỗi bị bỏ sót bằng sự hỗ trợ của chuyên gia, đảm bảo tính toàn diện và chính xác của nhãn.

Đồ họa quy trình hai giai đoạn của mô hình Defect-Gen
Nhóm nghiên cứu HKUST và Samaiku cũng đã đề xuất mô hình tạo lỗi Defect-Gen, một bộ tạo dựa trên sự lan truyền gồm hai giai đoạn.
Defect-Gen giải quyết vấn đề thiếu mẫu lỗi trong các bộ dữ liệu hiện tại, thông qua việc sử dụng dữ liệu lỗi công nghiệp cực kỳ ít để tạo ra hình ảnh và nhãn lỗi pixel, ngay cả trên các bộ dữ liệu nhỏ. Điều này mở ra khả năng mới cho việc áp dụng AI trong môi trường công nghiệp phức tạp.
Defect-Gen cải thiện sự đa dạng và chất lượng hình ảnh thông qua hai phương pháp chính: mô hình hóa cấp Patch và hạn chế vùng nhìn.
Để bù đắp sự thiếu hụt của mô hình hóa cấp Patch trong việc biểu diễn cấu trúc toàn bộ hình ảnh, nhóm nghiên cứu sử dụng mô hình với vùng nhìn rộng lớn trong các bước ban đầu để bắt giữ cấu trúc hình học, sau đó chuyển sang mô hình với vùng nhìn nhỏ hơn để tạo ra các Patch cục bộ, điều này tăng cường sự đa dạng mà không ảnh hưởng đến chất lượng hình ảnh. Bằng cách điều chỉnh điểm tiếp xúc và vùng nhìn của hai mô hình, mô hình đạt được sự cân bằng tốt giữa độ trung thực và sự đa dạng. Dữ liệu được tạo ra cũng có thể được sử dụng như một phần của vòng quay dữ liệu và tăng tốc quá trình.
Hiện tại, trong 5.438 mẫu lỗi của bộ dữ liệu Defect Spectrum, có 1.920 mẫu được tạo bởi Defect-Gen. Nhóm nghiên cứu đã đánh giá toàn diện bộ dữ liệu Defect Spectrum được áp dụng mô hình tạo lỗi Defect-Gen, chứng minh khả năng thích ứng và ưu thế của Defect Spectrum trong các thách thức phát hiện lỗi công nghiệp khác nhau.

Kết quả đánh giá một số mạng phát hiện lỗi trên bộ dữ liệu Defect Spectrum

Tiêu chuẩn đánh giá thực tế trên bộ dữ liệu Defect Spectrum

Thành tích xuất sắc của Defect Spectrum trong đánh giá thực tế
So với các bộ dữ liệu cũ, mô hình được huấn luyện trên bộ dữ liệu Defect Spectrum tăng 10.74% tỷ lệ phát hiện và giảm 33.1% tỷ lệ phát hiện sai.
Như được giới thiệu, việc áp dụng bộ dữ liệu Defect Spectrum cho phép hệ thống phát hiện lỗi phù hợp hơn với nhu cầu sản xuất thực tế, thực hiện quản lý lỗi hiệu quả và chính xác, đồng thời cung cấp dữ liệu quý giá cho việc bảo dưỡng dự đoán trong tương lai. Bằng cách ghi lại loại và vị trí của mỗi lỗi, nhà máy có thể liên tục tối ưu hóa quy trình sản xuất, cải thiện phương pháp sửa chữa sản phẩm, cuối cùng đạt được hiệu quả sản xuất và chất lượng sản phẩm cao hơn.
Hiện tại, bộ dữ liệu Defect Spectrum đã được áp dụng cho mô hình phát hiện lỗi thị giác của công ty Samaiku, và trong tương lai sẽ kết hợp với các mô hình lớn như IndustryGPT, được triển khai sâu rộng và phục vụ cho hoạt động kiểm tra chất lượng công nghiệp.
Trong kỷ nguyên thông minh này, công nghệ AI như một dòng chảy mạnh mẽ xâm nhập vào mọi ngành nghề, tái định hình sản xuất và lối sống. Công nghệ mô hình lớn dẫn dắt sự đổi mới, cải thiện hiệu quả ngành nghề, từ giảng dạy cá nhân hóa đến tiếp thị chính xác, từ giao tiếp ổn định hiệu quả đến quản lý rủi ro tài chính thông minh, AI không nơi nào không có. Nó không chỉ là tiền phong của sự đổi mới công nghệ, mà còn là lực đẩy mạnh mẽ cho sự phát triển kinh tế xã hội. Với sự hỗ trợ của AI, chúng ta đang hướng tới một tương lai thông minh, tiện lợi và hiệu quả hơn, trải nghiệm sự thay đổi cuộc sống và sự phát triển ngành nghề chưa từng có. Hãy theo dõi trang “AI Frontline” và trả lời “Ngành nghề ngàn lẻ một” để nhận miễn phí tư liệu trường hợp.
Tại Hội nghị AICon toàn cầu về Phát triển và Ứng dụng AI vào ngày 18-19 tháng 8 sắp tới, hơn 60 chuyên gia từ ByteDance, Huawei, Alibaba, Microsoft Research Asia, Beijing Academy of Artificial Intelligence, Shanghai Artificial Intelligence Laboratory, Nio Auto, Xiaohongshu, Zero One Wonders, và các tổ chức nghiên cứu hàng đầu khác sẽ tụ họp, mang đến các trường hợp và thực hành tốt nhất về ứng dụng AI và mô hình lớn trong các cảnh quát thực tế, giúp người tham dự nâng cao tầm nhìn công nghệ và nhận được hướng dẫn thực hành có giá trị. Đăng ký hội nghị đang nóng bỏng, xem thêm chi tiết hoặc liên hệ với quản lý vé 13269078023 để biết thêm thông tin.
Bạn cũng “đọc” không?
### Từ khóa:
– Phát hiện lỗi
– AI
– Dữ liệu
– Sản xuất thông minh
– Mô hình AI
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...