Li Kaifu: Không tham gia “cuộc chiến giá cả”, mô hình thử nghiệm mù được chào đón nhất trong nước.

công nghệ số5tháng trướccập nhật AIANT
41 00

Ngày 21 tháng 5, tại một sự kiện chia sẻ, Lý Khai Phục đã nói rằng “Mô hình của chúng tôi đã vượt qua các mô hình khác và chúng tôi hoan nghênh bất kỳ đối thủ nào không đồng ý đến LMSYS để thách đấu. Nhưng cho đến khi điều đó xảy ra, chúng tôi sẽ tiếp tục tuyên bố rằng chúng tôi là mô hình tốt nhất.” Lý Khai Phục tin tưởng vào Yi-Large, mô hình có kết quả đánh giá xuất sắc trong thời gian gần đây.

Vào ngày 20 tháng 5, trong bảng xếp hạng mới nhất của LMSYS Blind Test Arena, mô hình có 1 nghìn tỷ tham số của Yi-Large của ZeroOneWanwu đã đứng thứ bảy trên toàn cầu và đứng đầu trong số các mô hình Trung Quốc. Yi-Large đã vượt qua các mô hình như Llama-3-70B, Claude 3 Sonnet và đứng ngang hàng với GPT4o trong bảng xếp hạng tiếng Trung.

ZeroOneWanwu trở thành công ty duy nhất ở Trung Quốc có mô hình của mình lọt vào top 10 trong bảng xếp hạng tổng thể. Trong top 10 này, bốn vị trí thuộc về chuỗi sản phẩm GPT của OpenAI. ZeroOneWanwu, được xếp sau OpenAI, Google và Anthropic, chính thức bước vào hàng ngũ các công ty hàng đầu thế giới về mô hình lớn.

Lý do khiến ZeroOneWanwu tự hào là vì LMSYS là chuẩn mực vàng trong việc đánh giá mô hình lớn, với việc đánh giá được thực hiện một cách ẩn danh và mỗi mô hình đều được đánh giá bởi hàng ngàn người dùng. Kết quả này cũng được Sam Altman của OpenAI và Jeff Dean của Google đề cập đến trong việc công bố mô hình mới của họ.

Ngoài việc loại bỏ dữ liệu trùng lặp, LMSYS còn đưa ra bảng xếp hạng mới loại bỏ các câu hỏi dư thừa. Bảng xếp hạng này sẽ trở thành bảng xếp hạng mặc định trong tương lai, nhằm đảm bảo độ chính xác của bảng xếp hạng.

Sau khi loại bỏ các câu hỏi dư thừa, Yi-Large đã tăng điểm Elo của mình, đứng ngang hàng với Claude 3 Opus và GPT-4-0125-preview ở vị trí thứ tư.

Ngoài ra, trong số các nhà sản xuất mô hình lớn trong nước, GLM4 của Zhipei, Qwen Max và Qwen 1.5 của Alibaba, cùng Yi-Large và Yi-34B-chat của ZeroOneWanwu đều tham gia đánh giá ẩn danh. LMSYS cũng đã thêm đánh giá ngôn ngữ bằng tiếng Anh, tiếng Pháp và tiếng Trung, nhấn mạnh sự đa dạng của mô hình lớn toàn cầu.

Trong bảng xếp hạng phân loại, Yi-Large đã đạt thành tích nổi bật trong bảng xếp hạng khả năng lập trình, bảng xếp hạng câu hỏi dài và bảng xếp hạng khó khăn mới được thêm vào. Yi-Large đã đứng thứ hai trên toàn cầu trong bảng xếp hạng khả năng lập trình và bảng xếp hạng câu hỏi dài, ngang hàng với GPT-4-Turbo, GPT-4 và Claude 3 Opus.

Ngoài ra, trong bảng xếp hạng khó khăn mới, Yi-Large đã xử lý tốt các thử thách phức tạp từ người dùng, đứng thứ hai cùng với GPT-4-Turbo, GPT-4 và Claude 3 Opus.

Đối với vấn đề chi phí, Lý Khai Phục cho biết, “Trong kỷ nguyên mô hình lớn, chi phí đào tạo và suy luận là những thách thức mà mỗi công ty khởi nghiệp phải đối mặt.” ZeroOneWanwu đã chú trọng giảm chi phí và tin rằng chi phí suy luận sẽ giảm 10 lần mỗi năm.

Hiện tại, giá API của Yi-Large là 0,02 nhân dân tệ / 1.000 token, chỉ bằng khoảng một phần ba so với GPT-4 Turbo. Lý Khai Phục cho biết, “Nếu thị trường Trung Quốc chỉ quan tâm đến việc hạ giá, thì chúng tôi sẽ tập trung vào thị trường quốc tế.”

ZeroOneWanwu đang tiếp tục tuân theo quy luật mở rộng quy mô (Scaling Law), từ mô hình nhỏ nhất 6 tỷ đến 34 tỷ, và hiện tại là mô hình 1 nghìn tỷ, cũng như mô hình trillion MoE đang được huấn luyện. Lý Khai Phục tin rằng, quy mô và chất lượng dữ liệu đóng vai trò quan trọng trong việc nâng cao hiệu suất mô hình.

ZeroOneWanwu cũng đang tập trung vào việc thu hút và phát triển nhân tài đa lĩnh vực, từ thuật toán, cơ sở hạ tầng đến kỹ sư. Lý Khai Phục cho biết, “Những người giỏi nhất trong lĩnh vực của họ có thể tạo ra giá trị lớn hơn nhiều so với việc chỉ sử dụng số lượng lớn máy tính.”

ZeroOneWanwu đang nỗ lực để đạt được mục tiêu tạo ra mô hình lớn nhất và hiệu quả nhất tại Trung Quốc, đồng thời giảm thiểu chi phí suy luận. Với sự nỗ lực không ngừng, ZeroOneWanwu hy vọng sẽ dẫn đầu trong cuộc đua mô hình lớn.

Li Kaifu: Không tham gia

Từ khóa:

  • Mô hình lớn
  • ZeroOneWanwu
  • Yi-Large
  • LMSYS
  • Scaling Law
© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...