Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã “đấu” nhau! Không chỉ cạnh tranh về hiệu suất, mà còn về giá cả!

công nghệ số7tháng trướccập nhật AIANT
58 00

Mistral Large 2: Một Cuộc Cách Mạng Trong Thế Giới Mô Hình Ngôn Ngữ Mở

Hai ngày qua đã chứng kiến sự ra mắt của hai mô hình ngôn ngữ lớn từ các công ty hàng đầu trong ngành trí tuệ nhân tạo (AI). Đầu tiên, Meta đã giới thiệu mô hình mở mới Llama 3.1. Chỉ một ngày sau đó, startup AI người Pháp Mistral đã công bố phiên bản tiếp theo của mô hình mở của họ, Mistral Large 2, với 123 tỷ tham số.

Mistral Large 2 được thiết kế để cải thiện hiệu suất và giảm chi phí so với phiên bản trước, đạt được điều này thông qua việc tối ưu hóa trên một số bài kiểm tra chuẩn. Mặc dù không phải là mô hình hoàn toàn mở, Mistral Large 2 vẫn cung cấp quyền truy cập miễn phí cho mục đích nghiên cứu phi thương mại, nhưng yêu cầu giấy phép cho các ứng dụng thương mại.

Phiên bản Large 2 có khả năng xử lý nhiều ngôn ngữ hơn, bao gồm tiếng Bồ Đào Nha, Ả Rập, Hindi, Nga, Trung Quốc, Nhật Bản và Hàn Quốc. Điều này làm tăng khả năng đa dạng ngôn ngữ của mô hình so với phiên bản trước, đồng thời đưa nó lên ngang bằng với các đối thủ cạnh tranh như GPT-4o và GPT-4o mini.

Ngoài việc tăng cường khả năng xử lý mã, Mistral Large 2 cũng tập trung vào việc giảm thiểu vấn đề “ảo tưởng” – khi mô hình tạo ra thông tin không chính xác hoặc không liên quan. Mô hình này cũng thể hiện sự tinh gọn hơn trong phản hồi so với các mô hình hàng đầu khác.

Khi so sánh với Llama 3.1 405B, Mistral Large 2 thể hiện tốt hơn trong các thử nghiệm về mã và toán học, nhưng có phần kém hơn trong thử nghiệm đa ngôn ngữ. Tuy nhiên, cả hai mô hình đều không thể chối bỏ sự tiến bộ đáng kể mà chúng mang lại cho ngành AI.

Mistral Large 2 hiện đã có sẵn thông qua API của họ và trên các nền tảng đám mây như Google Vertex AI, Amazon Bedrock, Azure AI Studio và IBM WatsonX. Người dùng có thể thử nghiệm mô hình mới này thông qua chatbot của Mistral.

Việc ra mắt gần như đồng thời của hai mô hình lớn này đã gây ra nhiều cuộc thảo luận trong ngành. Mặc dù có ý kiến chỉ trích về việc Mistral Large 2 không hoàn toàn mở, nhiều người vẫn coi đây là một bước tiến đáng hoan nghênh so với mô hình đóng hoàn toàn.

Điều này cho thấy xu hướng trong ngành AI đang hướng tới việc tạo ra các mô hình hiệu quả hơn, nhanh hơn và rẻ hơn, đồng thời cung cấp sự cân nhắc giữa tính mở và bảo mật.

Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã Chỉ trong hai ngày, hai mô hình lớn Meta và Mistral đã

**Từ khóa:**
– Trí tuệ nhân tạo
– Mô hình ngôn ngữ
– Mở nguồn
– Công nghệ AI
– Đánh giá mô hình

© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...