Những rủi ro và lợi ích của việc áp dụng AI trong doanh nghiệp.

công nghệ số5tháng trướccập nhật AIANT
37 00





MiniMax: Đột phá trong Công nghệ Video và Mô hình Dữ liệu Lớn


Những rủi ro và lợi ích của việc áp dụng AI trong doanh nghiệp.

Đó là hiệu ứng từ mô hình video mới nhất của MiniMax, được gọi là video-01. “Chỉ là phiên bản đầu tiên của chúng tôi, và chúng tôi sẽ có phiên bản cập nhật hơn nữa,” ông Yan Junjie, người sáng lập của MiniMax, chia sẻ.

Nội bộ MiniMax, việc đa phương thức đã trở thành một điều chắc chắn.

“Trong xã hội con người, ý nghĩa cốt lõi của mô hình lớn là xử lý thông tin tốt hơn, và phần lớn thông tin được thể hiện qua nội dung đa phương thức, thay vì chỉ đơn thuần là văn bản, văn bản chỉ là một phần tinh túy nhỏ của nó,” ông Yan giải thích.

“Để đạt được mức độ bao phủ người dùng và sử dụng sâu rộng, cách duy nhất là có thể xuất bản nội dung động, thay vì chỉ xuất bản nội dung văn bản thuần túy, đây là một quyết định rất cốt lõi.” Tỷ lệ thâm nhập người dùng và mức độ sử dụng là những điều mà Yan Junjie đặc biệt quan tâm trong lần khởi nghiệp này. Theo ông, hai yếu tố này là chìa khóa để đạt được “Trí tuệ với mọi người”, cũng như là khả năng khác biệt của MiniMax.

Từ góc độ người dùng, MiniMax đã đạt được kết quả đáng khen ngợi. Theo thống kê, MiniMax tương tác hơn 3 tỷ lần mỗi ngày với người dùng toàn cầu, xử lý hơn 3 nghìn tỷ token văn bản, 20 triệu bức ảnh và 70.000 giờ âm thanh, lượng giao dịch hàng ngày của mô hình lớn đứng đầu trong số các công ty AI tại Trung Quốc.

Tuy nhiên, trong lĩnh vực tạo video, sự ra mắt của MiniMax không thể coi là sớm. Ông Yan giải thích rằng, “Chúng tôi đang giải quyết một vấn đề kỹ thuật khó khăn hơn: làm thế nào để đào tạo một thứ có sức mạnh tính toán cao một cách tự nhiên.”

Cụ thể, khi đào tạo khả năng tạo video, cần phải chuyển đổi video thành một loạt các token, và chuỗi token càng dài thì độ phức tạp càng tăng, đội ngũ của MiniMax phải làm việc trên thuật toán để giảm độ phức tạp và tăng tỷ lệ nén.

Hơn nữa, video còn rất lớn, ví dụ như một video 5 giây có kích thước vài megabyte, trong khi cùng thời gian đó, văn bản có thể chỉ chiếm chưa đến 1K. Điều này tạo ra sự chênh lệch lưu trữ lên đến ngàn lần. Do đó, cơ sở hạ tầng dựa trên mô hình văn bản trước đây không phù hợp cho mô hình video, điều này đòi hỏi phải nâng cấp cơ sở hạ tầng.

“Sau một hoặc hai tuần, khi có cái gì đó mới và đạt được trạng thái mà chúng tôi hài lòng hơn, chúng tôi có thể xem xét thương mại hóa,” ông Yan nói.

Những rủi ro và lợi ích của việc áp dụng AI trong doanh nghiệp.

Mô hình tạo video đã củng cố thêm niềm tin của ông Yan vào một điều: dù là video, văn bản hay âm thanh, trọng tâm không phải là việc một thuật toán mang lại cải thiện 5% hay 10%, mà quan trọng là tìm ra cách để cải thiện gấp nhiều lần. Nếu có thể cải thiện gấp nhiều lần, thì nhất định phải thực hiện, nếu chỉ cải thiện 5% thì không đáng làm.

“Từ lúc đi học, làm việc cho đến khi khởi nghiệp, hiểu biết của tôi về công nghệ dần dần trở nên rất đơn giản, đó là nguyên tắc đầu tiên. Công nghệ, đặc biệt là những công nghệ có đầu tư nghiên cứu lớn, mục tiêu không nên là cải thiện 10%, nếu một công nghệ chỉ cải thiện 10%, thì công nghệ đó không nên làm, bởi vì bạn không làm cũng sẽ có người khác làm hoặc công nghệ đó sẽ được mở nguồn, thực tế không cần phải tự mình phát triển,” ông Yan chia sẻ.

“Đối với việc khởi nghiệp, việc phân chia đồng tiền một cách cẩn thận là rất khó. Đối với công ty khởi nghiệp như chúng tôi, những nghiên cứu thực sự đáng giá để chi tiêu là những thứ có thể mang lại sự thay đổi gấp nhiều lần, những thứ này đôi khi nếu chúng tôi không tự làm, bên ngoài cũng không có, nhưng đối với việc đáp ứng nhu cầu của người dùng lại rất quan trọng, chỉ còn cách tự mình làm, đó chính là những thứ cốt lõi.”

Vậy, cốt lõi của mô hình dữ liệu lớn của MiniMax là gì?

Trả lời của ông Yan là: Nhanh = Tốt.

Sau khi xác định trước đường lối MoE, MiniMax đã giới thiệu thế hệ mô hình mới dựa trên MoE + Linear Attention. Qua kiến trúc mô hình tuyến tính mới này, mô hình lớn của MiniMax có thể huấn luyện dữ liệu khổng lồ một cách hiệu quả hơn trong đơn vị thời gian, cải thiện đáng kể tính thực tiễn và tốc độ phản hồi của mô hình.

So sánh với mô hình thế hệ mới cùng thế hệ với GPT-4o, mô hình mới của MiniMax có thể xử lý 100.000 token nhanh hơn 2-3 lần, và càng dài thì cải thiện càng rõ ràng. So với cấu trúc Transformer chung, trong chuỗi độ dài 128K, cấu trúc mới giảm chi phí hơn 90%.

“Dù là MoE, Linear attention hay bất kỳ điều gì khác, về bản chất, mục tiêu là làm cho mô hình có cùng hiệu quả nhưng nhanh hơn, nhanh mới có nghĩa là cùng sức mạnh tính toán có thể làm tốt hơn, đây là tư duy nghiên cứu cơ bản nhất của chúng tôi,” ông Yan chia sẻ.

“Trong thực tế áp dụng, giống như chúng ta chắc chắn không muốn NPC của Starfield chỉ nhớ được nội dung gần đây nhất là 8.000 chữ, điều này gây tổn hại lớn cho trải nghiệm người dùng, nếu có thể mở rộng quy mô lên 80.000 chữ, 800.000 chữ, thậm chí 8 triệu chữ, chắc chắn chúng ta có thể tạo ra sản phẩm khác biệt,” ông Han Jingtao, Giám đốc kỹ thuật của MiniMax, bổ sung.

Hiện tại, sản phẩm chủ lực của MiniMax tại thị trường Trung Quốc là Starfield và Hải Sâm AI.

“Khi một sản phẩm không được sử dụng hoặc không sinh lợi nhuận, chắc chắn không thể trách người dùng, hầu hết thời gian chỉ có thể trách bản thân công nghệ không đủ tốt hoặc sản phẩm không đủ tốt,” ông Yan chia sẻ.

Do đó, theo ông Yan, nguyên nhân cơ bản khiến mô hình dựa trên GPT-4 không hoạt động đúng như mong đợi không phải vì khung công việc Agent viết không tốt, mà vì mô hình không đủ tốt. “Mô hình hiện tại không có ký ức dài, không hiểu các lệnh phức tạp sẽ dẫn đến vấn đề này.”

Những lỗi hiện tại của tất cả các mô hình đều ở mức độ 20%. Theo ông Yan, sự thay đổi thực sự xảy ra khi có một mô hình có thể giảm lỗi xuống mức chữ số đơn, điều này sẽ khiến nhiều nhiệm vụ phức tạp từ “không thể” trở thành “có thể”.

“Khi công nghệ không tốt, mọi thứ đều trở thành vấn đề, khi công nghệ tốt, dường như mọi vấn đề đều được che giấu. Công nghệ là yếu tố cốt lõi nhất của một công ty công nghệ, tôi nghĩ tôi mất hai năm để nhận ra điều này,” ông Yan chia sẻ.

Theo ông Yan, việc làm công nghệ là một điều rất xa xỉ, điều này thậm chí chỉ có thể hiểu khi đang khởi nghiệp, vì làm công nghệ có thể thất bại và cần đầu tư lớn. Khi một thứ rất xa xỉ, thường sẽ muốn không cần đi đường tắt, ví dụ như không làm công nghệ, hãy cải thiện sản phẩm trước đã.

“Thực tế chứng minh, đi đường tắt sẽ bị đánh mặt,” ông Yan cười.

Hiện tại, mô hình thương mại hóa của MiniMax cơ bản được chia thành hai mô hình: một là nền tảng mở dành cho doanh nghiệp, hiện có hơn 2.000 khách hàng, bao gồm các công ty internet và doanh nghiệp truyền thống; hai là thiết lập cơ chế quảng cáo trong các sản phẩm của riêng mình để kiếm lợi nhuận.

“Ở giai đoạn hiện tại, quan trọng hơn không phải là thương mại hóa, mà là đạt được mức độ sử dụng rộng rãi của công nghệ,” ông Yan chia sẻ.

Đối với thị trường trong nước, MiniMax hy vọng tạo ra các sản phẩm dạng công cụ, ví dụ như sẽ liên tục mài dũa các chức năng mới cho Hải Sâm AI, cho đến khi tạo ra sự gắn kết mạnh mẽ giữa người dùng. “Khi cấu trúc gắn kết được xây dựng, chúng tôi mới xem xét ROI và Retention. Khi vòng quay này bắt đầu, chúng tôi mới tiến hành quảng cáo,” ông Sheng Jingyuan, Giám đốc kinh doanh quốc tế của MiniMax, chia sẻ.

Ông Sheng cho rằng, vòng quay ROI sẽ bắt đầu một ngày nào đó, nhưng không phải với hình thái sản phẩm hiện tại. “Như một người tiêu dùng thông thường, hình thái sản phẩm hiện tại không có bất kỳ sự trung thành nào. Nó bắt đầu thu phí và tôi có thể chuyển sang sản phẩm khác, mô hình này không ổn định.”

Tuy nhiên, thị trường quốc tế không giống như vậy. Các doanh nghiệp nước ngoài sẵn sàng trả phí, vì vậy việc làm cho công nghệ tinh tế rất quan trọng. “Đối với chúng tôi, công nghệ hiện đã hoàn thiện, vấn đề bây giờ là nguồn lực và tài nguyên công ty, cũng như cách kiếm lợi nhuận. Thị trường nước ngoài có cách tiếp cận riêng, sẽ tương đối trực tiếp hơn, và việc kiếm lợi nhuận cũng nhanh hơn.”

Thực tế, sản phẩm Talkie của MiniMax có thể nổi tiếng hơn sản phẩm trong nước. Trong danh sách ứng dụng di động hàng đầu 100 ứng dụng tạo AI tiêu dùng do tổ chức đầu tư hàng đầu a16z mới công bố, Talkie xếp hạng 22.

Ông Sheng kết luận rằng, bất kỳ sản phẩm 2 C vĩ đại nào cũng đều dựa trên suy nghĩ sâu sắc về nhân loại, và xem xét AI có thể làm gì trong môi trường có độ dung sai cao và biến nó thành sản phẩm được mọi người yêu thích.

Đua tranh trong lĩnh vực mô hình lớn vẫn tiếp tục. Ông Yan tỏ ra khá bình tĩnh, “Đây là một quy luật phát triển khách quan, đối với một công ty khởi nghiệp, nếu chúng tôi không thể chiến thắng trong cuộc đua, thì chúng tôi nên bị loại bỏ, thực sự không có lựa chọn khác.”

Trong cuộc cạnh tranh với các công ty lớn, ông Yan cho rằng, để chiến thắng, cần phải nhanh chóng nhìn thấy những điều rất cơ bản, “Khi các công ty lớn bắt đầu cạnh tranh với bạn, họ sẽ nhận ra một số thứ không hiệu quả, vì những thứ đó họ có thể làm tốt hơn hàng nghìn lần so với bạn. Những gì chúng ta có thể làm là mở rộng vô hạn những điều giúp chúng ta mạnh mẽ hơn: một là nâng cao công nghệ, hai là cùng người dùng tạo ra sản phẩm, hai phán đoán này rất quan trọng và cần sự tích lũy lâu dài.”

Về cuộc chiến giá cả của mô hình lớn trong nước, ông Yan cho rằng điều này đã lớn mạnh đáng kể lượng sử dụng mô hình, các công ty trước đây cho rằng mô hình lớn rất đắt, bao gồm cả nhiều doanh nghiệp truyền thống, bắt đầu sử dụng mô hình lớn, vì chi phí thấp, độ chịu lỗi cũng cao hơn một chút. “Chính sự cạnh tranh gay gắt này đã thúc đẩy mọi người phải làm mô hình tốt hơn. Một thời điểm nào đó sau này, mọi người sẽ nhận ra mô hình của họ cũng có khả năng cạnh tranh ở nước ngoài, ví dụ như Đông Nam Á, ít nhất hiện tại, mô hình của họ đã không thua kém GPT về ngôn ngữ không phải tiếng Anh.”

“Chúng tôi nhìn thấy khía cạnh lạc quan, lượng sử dụng mô hình lớn trong nước thực sự đang tăng đáng kể, và mô hình của Trung Quốc ở nước ngoài thực sự ngày càng có khả năng cạnh tranh, tôi nghĩ đây là hai thay đổi tích cực,” ông Yan chia sẻ.

Ngày 18-19 tháng 8 năm 2024, Hội nghị Toàn cầu về Phát triển và Ứng dụng Trí tuệ Nhân tạo · Thượng Hải đã diễn ra thành công, tập hợp hơn 60 nhà tiên phong trong ngành mô hình lớn, phân tích toàn diện cơ chế huấn luyện và suy luận của mô hình lớn, sự kết hợp đa phương thức, tiến bộ hàng đầu về trí tuệ nhân tạo Agent, chiến lược tạo ra chiến lược tăng cường (RAG) và tối ưu hóa mô hình bên cạnh thiết bị.


**Từ khóa:**
– MiniMax
– Trí tuệ nhân tạo
– Mô hình dữ liệu lớn
– Video
– Cạnh tranh

© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...