22 người được định giá 2 tỷ USD, tăng gấp bảy lần trong nửa năm, “OpenAI châu Âu” phát hành mô hình “trọng số mở” tương đương GPT-3.5.

công nghệ số5tháng trướccập nhật AIANT
43 00

Mistral AI: Sự Khởi Sóng của Công Ty Trí Tuệ Nhân Tạo Trụ Trụ Tại Paris

Trong bảy tháng kể từ khi được thành lập bởi các nhà nghiên cứu từ Meta và Google, công ty khởi nghiệp Mistral AI đã thu hút được sự chú ý lớn với việc huy động thành công 385 triệu euro (khoảng 415 triệu đô la Mỹ). Điều này một lần nữa khẳng định niềm tin vào tiềm năng của trí tuệ nhân tạo (AI) trong lĩnh vực tạo ra nội dung.

Theo hai nguồn tin quen thuộc với vấn đề này, giao dịch này đã đưa giá trị của công ty lên khoảng 2 tỷ đô la Mỹ. Hiện tại, công ty có 22 nhân viên và danh sách nhà đầu tư bao gồm các công ty mạo hiểm hàng đầu như Andreessen Horowitz và Lightspeed Venture Partners, cùng với Salesforce và BNP Paribas.

Một điều đáng chú ý là giá trị của công ty đã tăng gấp bảy lần chỉ trong sáu tháng. Đặc biệt, vào mùa hè này, công ty đã hoàn thành vòng huy động vốn hạt giống 105 triệu euro (khoảng 113 triệu đô la Mỹ), khi đó giá trị của công ty là khoảng 2,6 tỷ đô la Mỹ.

22 người được định giá 2 tỷ USD, tăng gấp bảy lần trong nửa năm,

Cùng với việc huy động vốn, Mistral AI cũng đã giới thiệu mô hình mới Mixtral 8x7B LLM. Mô hình này được gọi là mô hình “trọng lượng mở”, thiết lập tiêu chuẩn mới về hiệu suất và đã mở cửa cho truy cập trên nền tảng thương mại của họ.

Mistral AI đã công bố mô hình mới của mình, Mixtral 8x7B, được cho là vượt trội hơn so với mô hình Llama 2 và GPT-3.5 của Meta và OpenAI. Các thử nghiệm cho thấy Mixtral hoạt động tốt hơn hoặc tương đương với hai đối thủ cạnh tranh này, đồng thời có chi phí và độ trễ thấp hơn.

Mistral AI tuyên bố rằng đây là mô hình hỗn hợp chuyên gia chất lượng cao (SMoE), có thể sử dụng dưới giấy phép Apache 2.0 cho mục đích thương mại. Hơn nữa, Mixtral đã chứng tỏ khả năng vượt trội so với Llama 2 70B, với tốc độ suy luận nhanh hơn 6 lần.

22 người được định giá 2 tỷ USD, tăng gấp bảy lần trong nửa năm,

Mistral AI nhấn mạnh rằng đây là mô hình mở trọng lượng nhất với giấy phép rộng rãi, và cũng là mô hình tốt nhất trong việc cân nhắc giữa chi phí và hiệu suất. Đặc biệt, nó đạt được hoặc vượt qua hiệu suất của GPT3.5 trong hầu hết các bài kiểm tra chuẩn.

Mixtral có khả năng xử lý 32k token và hỗ trợ nhiều ngôn ngữ như tiếng Anh, Pháp, Ý, Đức và Tây Ban Nha, cũng như khả năng tạo mã xuất sắc. Ngoài ra, họ còn công bố phiên bản huấn luyện lại (Instruct) của mô hình, đạt điểm 8.3 trên bảng xếp hạng MT-Bench.

22 người được định giá 2 tỷ USD, tăng gấp bảy lần trong nửa năm,

Mistral AI đã công bố rằng Mixtral có tổng cộng 46.7 tỷ tham số, nhưng mỗi token chỉ sử dụng 12.9 tỷ, nghĩa là tốc độ suy luận và chi phí tương đương với 12.9 tỷ.

Người chơi trong lĩnh vực AI đã bắt đầu tải xuống, chạy và thử nghiệm Mixtral 8x7B và rất ấn tượng với hiệu suất và lợi thế về chi phí của nó:

22 người được định giá 2 tỷ USD, tăng gấp bảy lần trong nửa năm,

Ngoài ra, đáng chú ý là kết quả thử nghiệm chính thức thiếu thông tin về TruthfulQA, thường được sử dụng để kiểm tra khả năng của mô hình không lặp lại thông tin sai lệch phổ biến trên mạng. Dù sao, Mistral vẫn nhấn mạnh rằng so với lựa chọn của OpenAI và Meta, chi phí vận hành của mô hình của họ thấp hơn nhiều, một lợi thế rõ ràng.

Cùng ngày, Mistral cũng đã công bố nền tảng mở của họ, La plateforme, và niêm yết ba mô hình:

  • Mistral-tiny: Mô hình tiết kiệm chi phí nhất, hiện đang cung cấp phiên bản cập nhật nhỏ hơn của Mistral 7B Instruct v0.2, chỉ dành cho tiếng Anh, đạt 7.6 điểm trên bảng xếp hạng MT-Bench.
  • Mistral-small: Mixtral 8x7B, có khả năng xử lý tiếng Anh, Pháp, Ý, Đức và Tây Ban Nha, cũng như mã nguồn, đạt 8.3 điểm trên bảng xếp hạng MT-Bench.
  • Mistral-medium: Mô hình cao cấp nhất, có khả năng xử lý tất cả các ngôn ngữ trên và mã nguồn, đạt 8.6 điểm trên bảng xếp hạng MT-Bench.
22 người được định giá 2 tỷ USD, tăng gấp bảy lần trong nửa năm,

Công ty cũng cung cấp endpoint embed, một mô hình nhúng với 1024 chiều nhúng, thiết kế để có khả năng tìm kiếm, đạt 55.26 điểm trên bảng xếp hạng MTEB.

Mặc dù công ty theo đuổi con đường mã nguồn mở, họ không tránh khỏi việc thương mại hóa. Mặc dù hai mô hình có thể tải xuống trực tiếp, nhưng mô hình tốt nhất của họ hiện chỉ có thể truy cập qua API: công ty dự định kiếm tiền từ mô hình cơ sở của họ. Đó là lý do tại sao họ đã mở nền tảng phát triển thử nghiệm hôm nay. Với nền tảng này, các công ty khác sẽ có thể trả phí để sử dụng mô hình của Mistral AI thông qua API.

“API của chúng tôi tuân theo quy chuẩn giao diện trò chuyện phổ biến mà người cạnh tranh thân yêu nhất của chúng tôi đã đưa ra. Chúng tôi cung cấp thư viện khách hàng bằng Python và Javascript để truy vấn các điểm cuối của chúng tôi.”

“Mỗi điểm cuối đều cân nhắc giữa hiệu suất và giá cả.”

Mistral AI, còn được gọi là “OpenAI của châu Âu”, được thành lập bởi Arthur Mensch (hiện là CEO), Guillaume Lample và Timothee Lacroix, những người trước đây từng làm việc tại Meta Platforms và Alphabet. Công ty được thành lập vào tháng 5 năm 2023, chuyên phát triển các mô hình ngôn ngữ lớn và các công nghệ AI khác. Tên gọi Mistral lấy cảm hứng từ gió lạnh mùa đông, thể hiện khát vọng của họ trong việc chiếm lĩnh vị trí trong lĩnh vực AI.

Vào tháng 6, sau khi huy động thành công 113 triệu đô la Mỹ trong vòng hạt giống, Mistral AI đã gây tiếng vang trong ngành công nghiệp, đưa giá trị của công ty lên 2,6 tỷ đô la Mỹ. Khi đó, công ty chỉ mới thành lập với 6 nhân viên và chưa sản xuất bất kỳ sản phẩm nào, chỉ dựa vào 7 trang trình bày.

Dù hiện tại chỉ có khoảng 20 nhân viên, nhưng Mistral AI đã thành công trong việc đạt được mức định giá 2 tỷ đô la Mỹ và dễ dàng ra mắt mô hình 7B và 8x7B MOE hiệu suất cao. “Tôi nghĩ rằng điều này có thể là mối đe dọa lớn hơn cho OpenAI so với Google hoặc Anthropic,” một người dùng Hacker News nhận xét. “Như đã thấy từ khoản đầu tư lớn gần đây, tôi tin rằng họ sẽ có thể a) mở rộng khả năng đối phó với lưu lượng hợp lý trong tương lai gần, b) thu hút các nhà nghiên cứu hàng đầu và thông minh nhất, và tạo ra sự chú ý đáng kinh ngạc và kịch tính trong ngành.”

CEO của Mistral AI, Arthur Mensch, đã nhấn mạnh rằng mục tiêu của công ty là “phát triển hệ thống AI thế hệ tiếp theo có thể giải quyết các vấn đề thực tế”, và từ ban đầu đã kiên định với con đường mã nguồn mở. Họ đã công bố mô hình lớn đầu tiên của mình, Mistral 7B, được gọi là “mô hình mở mạnh nhất 7B”.

Jim Fan, nhà khoa học nghiên cứu cấp cao tại Nvidia, đã bình luận rằng yếu tố thành công của Mistral nằm ở thời điểm thành lập tuyệt vời: sinh ra trong cuộc tranh cãi giữa mã nguồn mở và không mã nguồn mở, và được thúc đẩy bởi một đội ngũ tinh nhuệ.

Ngoài ra, hàng chục mô hình mới ra mắt mỗi tháng, nhưng ít mô hình thu hút được sự chú ý của công chúng. Trong khi đó, 7B và 7B-MoE (tương đương với 12B mật) lại trở nên thân thiện hơn với các kỹ sư AI cơ bản, dễ xây dựng hơn. Và với tư cách là mô hình ngôn ngữ “địa phương hóa” của châu Âu, Mistral AI đã tạo ra sự khác biệt. Có thể nói, đội ngũ ban đầu mạnh mẽ và mục tiêu phát triển đầy tham vọng đã khiến công ty trở thành một trong những lực lượng khởi nghiệp AI đáng chú ý nhất hiện nay và trong những năm tới.

Từ khóa:

  • Trí tuệ nhân tạo
  • Mistral AI
  • Mixtral 8x7B
  • La plateforme
  • Thị trường AI
© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...