Wall Street Intelligence âm thầm phát hành mô hình lớn mã nguồn mở “Người xuất sắc trong khoa học tự nhiên”! Cuộc thi LeetCode hàng tuần vượt qua 80% người tham gia.
Trước khi ra mắt Llama3 vào ngày 18 tháng 4, Công ty Mặt Trận đã âm thầm mở nguồn mô hình lớn Eurux-8x22B. Được biết, mô hình này đã vượt qua Llama3-70B trong các bài kiểm tra phức tạp như mã hóa và toán học, trở thành mô hình mở nguồn hàng đầu về khả năng giải quyết vấn đề khoa học tự nhiên.

Mô hình Eurux-8x22B và dữ liệu đối ứng đã được mở toàn bộ. Cụ thể, Eurux-8x22B đã vượt qua các bài kiểm tra thách thức như LeetCode (180 câu hỏi thực tế về lập trình) và TheoremQA (câu hỏi về khoa học, công nghệ, kỹ thuật và toán học của Mỹ).

Với khả năng lập trình xuất sắc, Eurux-8x22B đã tham gia một cuộc thi tuần trên LeetCode gần đây, nơi mà con người và máy móc cùng tranh tài về kỹ năng lập trình.

Ngoài khả năng lập trình, Eurux-8x22B còn tỏ ra rất dễ dàng khi giải các bài toán toán học.

Công ty Mặt Trận là một trong số ít nhóm tại Trung Quốc có khả năng về thuật toán và cơ sở hạ tầng cho mô hình lớn. Họ đã tạo ra một quy trình sản xuất mô hình hiệu quả từ nguyên liệu dữ liệu đến quá trình huấn luyện và hiệu chỉnh.

Ngoài việc sử dụng dữ liệu UltraInteract chất lượng cao, Eurux-8x22B còn được cải thiện thông qua hai thuật toán ưu tiên khác, KTO và NCA, giúp tăng cường hiệu suất của mô hình.

Tương lai, Công ty Mặt Trận sẽ tiếp tục mở nguồn các mô hình lớn và dữ liệu của họ, góp phần vào sự phát triển chung của ngành trí tuệ nhân tạo.
Từ khóa:
- Mô hình lớn
- Eurux-8x22B
- Công ty Mặt Trận
- UltraInteract
- Trí tuệ nhân tạo
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...