SemiKong: Mô hình ngôn ngữ AI đầu tiên dành cho ngành bán dẫn
Ngày 10 tháng 7, công ty khởi nghiệp nước ngoài Aitomatic đã công bố ra mắt SemiKong. Đây là mô hình ngôn ngữ AI lớn (LLM) nguồn mở đầu tiên trên thế giới được thiết kế đặc biệt cho ngành bán dẫn. Nó nhằm giải quyết một số thách thức mà ngành bán dẫn đang đối mặt, như các vấn đề về vật lý và hóa học liên quan đến thiết bị và quy trình bán dẫn.

SemiKong được phát triển bởi các thành viên của Liên minh Trí tuệ nhân tạo (AI Alliance). Liên minh này được thành lập vào năm 2023, với mục tiêu xây dựng, hỗ trợ và thúc đẩy đổi mới mở trong lĩnh vực công nghệ AI, bao gồm phần mềm, dữ liệu và mô hình, an ninh mạng, công cụ, đánh giá, phần cứng, giáo dục, khoa học mở và truyền thông.
SemiKong dựa trên mô hình Llama3 do Meta mở nguồn, sử dụng kiến thức chuyên môn từ các công ty hàng đầu trong ngành bán dẫn như Tokyo Electron và các chuyên gia AI như FPT Software. Anthony Annunziata, người phụ trách đổi mới mở tại IBM Research, nhấn mạnh rằng sự ra đời của phiên bản SemiKong DRAFT v0.6 cho thấy việc tập hợp các kiến thức khác nhau có thể thúc đẩy tiến bộ quan trọng trong các ngành công nghiệp then chốt như sản xuất bán dẫn.
Quá trình huấn luyện SemiKong bao gồm ba giai đoạn chính: tiền huấn luyện kiến thức lĩnh vực – tự điều chỉnh (dữ liệu hướng dẫn) – hợp nhất và định lượng. Từ mã nguồn và trọng số được công bố, có thể thấy SemiKong có 8 tỷ tham số. Nó thể hiện sự tiến bộ đáng kể về độ chính xác, liên quan và hiểu biết về quy trình bán dẫn.
Aitomatic cho biết, ngay cả phiên bản nhỏ hơn của nó cũng thường vượt trội so với các mô hình tổng quát lớn hơn trong ứng dụng lĩnh vực cụ thể, giúp tăng tốc đổi mới toàn bộ chuỗi giá trị bán dẫn và giảm chi phí. Đồng thời, nó cũng cung cấp một nền tảng quý giá cho các công ty chip muốn xây dựng mô hình chuyên dụng riêng.

Với việc SemiKong giảm chi phí sản xuất bán dẫn, người tiêu dùng có thể mong đợi thấy các thiết bị di động thông minh, máy tính xách tay và thiết bị nhà thông minh có chức năng mạnh mẽ hơn với giá thấp hơn trong những năm tới. SemiKong bắt đầu được tải xuống từ HuggingFace và GitHub vào ngày 9 tháng 7 năm 2024. Phiên bản mạnh mẽ hơn sẽ được ra mắt vào tháng 12 năm 2024, và phiên bản đầu tiên của các mô hình quy trình cụ thể sẽ ra mắt vào tháng 9 năm 2024.
Địa chỉ nguồn mở: https://github.com/aitomatic/semikong
Christopher Nguyen, Giám đốc điều hành của Aitomatic, người lãnh đạo dự án SemiKong, cho biết: “SemiKong sẽ tái định nghĩa ngành công nghiệp sản xuất bán dẫn. Mô hình đổi mới mở này do Liên minh Trí tuệ nhân tạo hỗ trợ, tận dụng kiến thức tập thể để đối phó với các thách thức cụ thể của ngành. Tại Aitomatic, chúng tôi đang sử dụng SemiKong để tạo ra các trí tuệ nhân tạo lĩnh vực cụ thể, giải quyết các vấn đề sản xuất phức tạp với hiệu suất chưa từng có.”
Daisuke Oku, chuyên gia cao cấp của Tokyo Electron và người đề xuất sớm về mô hình bán dẫn, bổ sung: “SemiKong là một khởi đầu đầy hứa hẹn cho trí tuệ nhân tạo nguồn mở trong ngành bán dẫn. Cách tiếp cận đổi mới của Aitomatic có thể mang lại bước nhảy vọt lớn cho ngành của chúng tôi.”