Stability, Mistral, Databricks, Tongyi và A21 Labs tung ra năm đòn mở, trong đó ba cái là MoE! | Tin tức tuần về mô hình lớn.
AI và các mô hình lớn: Tin tức nóng hổi hàng tuần
AI và các mô hình lớn: Tin tức nóng hổi hàng tuần

Ngày nay, với sự xuất hiện liên tiếp của năm mô hình mở nguồn, lĩnh vực AI đang chứng kiến sự bùng nổ về nghiên cứu và phát triển. Đặc biệt, các mô hình dựa trên hệ thống chuyên gia (MoE) đang trở thành xu hướng mới trong việc tạo ra các mô hình ngôn ngữ lớn hơn và hiệu quả hơn.
Một số mô hình đáng chú ý như Stability AI đã công bố Stable Code Instruct-3B, Mistral AI đã giới thiệu Mistral 7B v0.2 Base Model, Databricks đã mở nguồn mô hình MoE của họ là DBRX, nhóm nghiên cứu Qwen đã công bố mô hình MoE Qwen1.5-MoE-A2.7B, và A21 Labs cũng đã công bố mô hình MoE Jamba. Những mô hình này đều tập trung vào cải thiện hiệu suất và khả năng xử lý tác vụ phức tạp thông qua việc phân chia tải tính toán cho các chuyên gia riêng biệt.
Các mô hình đa phương thức cũng đang thu hút sự chú ý của cộng đồng. Nhóm nghiên cứu từ Đại học Khoa học và Công nghệ Trung Hoa và công ty Kingsoft đã giới thiệu mô hình đa phương thức TextMonkey, một mô hình tập trung vào việc hiểu văn bản và hình ảnh trong tài liệu. TextMonkey đã chứng minh khả năng vượt trội trong việc xử lý các tác vụ liên quan đến văn bản và tài liệu, mở ra nhiều cơ hội ứng dụng trong ngành công nghiệp.
Ngoài ra, nhóm nghiên cứu Suno đã giới thiệu mô hình V3 có khả năng tạo ra âm nhạc chất lượng cao. Mô hình này có thể tạo ra từ lời bài hát đến giọng hát và dàn nhạc, thậm chí có thể điều chỉnh theo phong cách âm nhạc mong muốn. Một nghiên cứu khác từ Đại học Lehigh và Microsoft Research đã đề xuất khung đa-agents Mora, giúp sao chép khả năng tạo video tổng quát của Sora. Các nghiên cứu này đều cho thấy sự tiến bộ đáng kể trong việc tạo ra các mô hình AI đa phương thức và đa tác vụ.
Trong lĩnh vực hạ tầng, công ty Yun Tianli fei đã công bố sản phẩm mô hình AI “Shenmu” với khả năng học tập và tự cập nhật thuật toán trực tuyến. Sản phẩm này đã giải quyết vấn đề về việc áp dụng mô hình AI trong thực tế, giảm chi phí sử dụng và tăng độ chính xác của thuật toán.
Cuối cùng, sự kiện AICon Global Artificial Intelligence & Large Model Development and Application Conference sẽ được tổ chức vào ngày 17 tháng 5, với chủ đề “Tương lai thông minh: Khám phá vô tận của AI”. Sự kiện này sẽ cung cấp cái nhìn sâu sắc về các xu hướng và ứng dụng của AI trong tương lai.
Từ khóa:
- AI
- Mô hình lớn
- Tin tức nóng hổi
- Mô hình đa phương thức
- Hạ tầng AI
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...