iFLYTEK xây dựng mô hình lớn: Không cần phải xuất sắc ở mọi tính năng, trước tiên hãy phát triển khả năng cần thiết cho doanh nghiệp.

công nghệ số5tháng trướccập nhật AIANT
42 00
iFLYTEK xây dựng mô hình lớn: Không cần phải xuất sắc ở mọi tính năng, trước tiên hãy phát triển khả năng cần thiết cho doanh nghiệp.

Một trong những tổ chức hàng đầu về nghiên cứu và phát triển công nghệ AI là Viện Nghiên cứu của Tập đoàn iFlytek. Theo lời ông Liu Cong, phó giám đốc và giám đốc viện, việc này không chỉ là một tổ chức nghiên cứu công nghệ đơn thuần. Từ khi thành lập vào năm 2005, Viện Nghiên cứu đã cung cấp hỗ trợ kỹ thuật quan trọng cho các sản phẩm của Tập đoàn iFlytek, và điều này cũng không ngoại lệ trong đợt sóng lớn về mô hình đại diện (large models).

Ông Liu Cong nói rằng “Hầu hết các công nghệ của chúng tôi đều liên quan đến nhu cầu kinh doanh cụ thể.” Viện Nghiên cứu không ngừng cải tiến các mô hình cơ sở của mình đồng thời cũng nghiên cứu sâu hơn vào nhu cầu kinh doanh.

Vào tháng 12 năm 2022, Tập đoàn iFlytek đã khởi xướng dự án “1+N công nghệ và ứng dụng mô hình đại diện AI”. Trong đó, “1” đại diện cho nền tảng mô hình đại diện AI chung, còn “N” đại diện cho việc áp dụng công nghệ mô hình đại diện AI vào nhiều lĩnh vực như giáo dục, y tế, ô tô, văn phòng, và thiết bị thông minh. Vậy sự hiểu biết của Tập đoàn iFlytek về “1” và “N” đã thay đổi như thế nào?

Từ khi phiên bản đầu tiên của mô hình Starfire được ra mắt vào tháng 5 năm ngoái, Viện Nghiên cứu đã nâng cấp mô hình này lên phiên bản 4.0. Mô hình cũng đã được cập nhật từ việc so sánh với GPT-3.5 đến GPT-4 Turbo mới nhất.

Năm ngoái, Tập đoàn iFlytek đã công bố nhiều sản phẩm, hầu như mỗi hai đến ba tháng lại có một sản phẩm mới. So với trước đây, khi chỉ công bố một sản phẩm mỗi năm, nhịp độ này nhanh hơn rất nhiều.

Ông Liu Cong cho biết, vào thời điểm này, Tập đoàn iFlytek đang đóng vai trò là “người theo đuổi”, tìm kiếm kinh nghiệm trong quá trình đào tạo mô hình lớn, như cách xử lý dữ liệu, quy luật mở rộng (scaling law) có phù hợp hay không, và đối sánh với các mô hình hàng đầu quốc tế. Đồng thời, họ cũng tập trung vào một số tình huống thực tế. Ngoài ra, việc thúc đẩy công nghệ nội địa hóa cũng là ưu tiên hàng đầu.

Theo ông Liu Cong, tốc độ phát triển của Tập đoàn iFlytek trong năm qua là khá tốt, điều này xuất phát từ việc hoạch định kế hoạch phát hành một cách kỹ lưỡng, giúp mọi người cảm nhận được sự thay đổi giữa các phiên bản lớn.

Tuy nhiên, hướng đi trong năm nay đã khác biệt so với năm trước.

“Ngay từ đầu năm, chúng tôi đã nắm vững rõ ràng về mô hình lớn này,” ông Liu Cong nói. “Hiện tại, chúng tôi vừa chú trọng vào nền tảng mô hình lớn, vừa khám phá cách cải thiện hiệu quả của mô hình nhỏ.”

Hiện nay, sự phát triển song song của mô hình lớn và mô hình nhỏ đã trở thành xu hướng ngành. Ông Liu Cong cho biết việc lựa chọn mô hình lớn hay nhỏ phụ thuộc vào nhu cầu của từng tình huống. “Nếu chỉ nói một cách chung chung rằng sử dụng mô hình nhỏ không khác gì mô hình lớn, điều đó hoàn toàn sai lầm.”

Ông Liu Cong giải thích rằng, trong việc viết văn bản, mã nguồn, một mô hình vừa phải có thể giải quyết vấn đề, Tập đoàn iFlytek gọi loại ứng dụng này là tác vụ thông thường. Các tác vụ trung bình liên quan đến nhiều kho kiến thức và nội dung chuyên sâu trong ngành, cũng như các tác vụ khó khăn như suy luận phức tạp, suy luận toán học, hiện tại cả mô hình lớn và nhỏ đều chưa thể giải quyết.

“Chúng tôi luôn nhấn mạnh rằng cả thời kỳ mô hình lớn và mô hình nhỏ không có nghĩa là không còn chú trọng đến mô hình lớn nữa. Nguyên tắc cốt lõi là tìm hiểu giới hạn của mô hình lớn trước, sau đó tối ưu hóa mô hình nhỏ. Sự tiến bộ liên tục của mô hình nhỏ phụ thuộc vào sự phát triển của mô hình lớn,” ông Liu Cong nói.

Ngoài ra, nhiệm vụ quan trọng của Viện Nghiên cứu là đưa công nghệ mô hình lớn vào các tác vụ cần thiết, vì vậy giải quyết các vấn đề hệ thống một cách sâu sắc trở nên cực kỳ quan trọng.

Tuy nhiên, trong số các khả năng cơ bản, Tập đoàn iFlytek cũng chọn lọc để nghiên cứu. Ví dụ, trong các tác vụ chung, một trong những khả năng mà Tập đoàn iFlytek quan tâm nhất là toán học, bởi vì theo ông Liu Cong, khả năng toán học kết hợp với suy luận là biểu hiện của sự thông minh của mô hình lớn.

Tuy nhiên, khác với một số công ty có sản phẩm riêng về tạo hình ảnh từ văn bản, Tập đoàn iFlytek sử dụng tính năng này trong cổng thông tin Starfire thống nhất. Ông Liu Cong rõ ràng cho biết, “Trong việc tạo hình ảnh từ văn bản, ưu tiên của tôi thấp hơn, thậm chí không đặc biệt tạo video từ văn bản. Mặc dù chúng tôi không liên quan nhiều đến video, nhưng chúng tôi sẽ tạo nhân vật ảo, tăng cường khả năng âm thanh, và chúng tôi phải làm tốt giao tiếp bằng giọng nói.”

Trong quan điểm của ông Liu Cong, nền tảng mô hình lớn hướng tới việc đa dạng hóa, và khả năng đa dạng hóa của Tập đoàn iFlytek ngày càng tăng. Tuy nhiên, không cần phải đầu tư quá nhiều vào các lĩnh vực không liên quan và yêu cầu nguồn lực lớn. Trong lĩnh vực đa dạng hóa, ông Liu Cong sẽ tập trung vào OCR (nhận dạng ký tự quang học), “Đảm bảo OCR đạt mức tốt nhất, điều này liên quan chặt chẽ với công việc thực tế của tôi.”

Dựa trên điều này, trọng tâm của Tập đoàn iFlytek trong năm nay vẫn là xây dựng khả năng chung của mô hình lớn, nhưng không cố gắng cạnh tranh ở mọi lĩnh vực, mà tập trung vào những hướng mà Tập đoàn cho là quan trọng nhất, ví dụ như khả năng giao tiếp.

Công việc nghiên cứu của Viện Nghiên cứu liên kết chặt chẽ với nhu cầu kinh doanh. Trước khi bắt đầu nghiên cứu, Viện cần đạt được sự đồng thuận sâu sắc với các phòng ban kinh doanh, ví dụ như một chức năng cần đạt đến mức độ nào, việc hoàn thành các chỉ số kỹ thuật khách quan sẽ mang lại giá trị gì cho người dùng.

Sau khi đạt được sự đồng thuận, quá trình từ các phòng ban nghiên cứu bên trong, phòng ban kỹ thuật, phòng ban dịch vụ, đến phòng ban sản phẩm, cần cùng nhau điều chỉnh. Dù là phát hành sản phẩm, sau đó liên tục cải tiến, hay sáng tạo một sản phẩm mới, quy trình này đều được áp dụng.

Tập đoàn iFlytek được coi là một trong những doanh nghiệp hiếm hoi có thể thực sự biến công nghệ thành sản phẩm, theo ông Liu Cong, nguyên nhân chính là Tập đoàn này đã nghiên cứu sâu hơn vào các tình huống cụ thể.

“Chúng tôi tìm thấy PMF (Product-Market Fit) một cách chính xác, bởi vì chúng tôi đã tích lũy kiến thức về ngành và công nghệ trong quá khứ. Tuân thủ nguyên tắc bậc thang, chúng tôi hiểu mô hình lớn có thể thích ứng ở điểm nào, và tình huống nào có thể phát huy giá trị,” ông Liu Cong nói. “Ngoài ra, Tập đoàn iFlytek cũng có nguồn lực và cơ sở người dùng phong phú.”

Ví dụ, về máy học tập, Tập đoàn iFlytek đã làm việc với trường học trong mười mấy năm qua, liên tục tìm hiểu chính sách giáo dục và xu hướng tương lai của Trung Quốc. Điều kiện giảng dạy của giáo viên như thế nào, trẻ em ở các độ tuổi khác nhau có thời gian học thêm hay không, nếu chỉ dựa vào tưởng tượng và phán đoán thì rất khó xác định. Ngành giáo dục nhấn mạnh phương pháp dạy học phù hợp, chứ không chỉ là công nghệ hình ảnh và văn bản.

Trong việc triển khai, việc khám phá mô hình lớn trên nền tảng ngành đã được tích lũy là chiến lược rủi ro thấp mà hầu hết các công ty tương đối trưởng thành sẽ chọn. “Việc tự cung cấp nguồn lực rất quan trọng, vì vậy chúng tôi tập trung vào những hướng quen thuộc, ví dụ như giáo dục, y tế, văn phòng, ô tô và tài chính.”

Thời điểm hoàn thành ứng dụng cũng liên quan đến giai đoạn phát triển của mô hình lớn. Xung quanh các tình huống cần thiết, công nghệ nào có thể hỗ trợ, mức độ hỗ trợ như thế nào đều cần được xem xét. Ví dụ, công nghệ chấm điểm bài thi, trước đây chỉ kiểm tra trắc nghiệm và lựa chọn, sau đó mở rộng đến câu trả lời và chấm điểm tất cả các môn học, điều này đòi hỏi yêu cầu kỹ thuật ngày càng cao hơn. Với sự xuất hiện của mô hình lớn, một biểu hiện trực quan là việc chấm điểm bài văn đã được cải thiện đáng kể.

Trong hoạt động kinh doanh của Tập đoàn iFlytek, phần cứng không thể bỏ qua, ví dụ như máy học tập, máy chấm bài, v.v. Một trong những đặc điểm của hoạt động kinh doanh của Tập đoàn iFlytek là mỗi ngành đều có sự khác biệt về phần cứng và phần mềm. Ví dụ, máy học tập liên tục thêm các chức năng phần mềm vào phần cứng, nhằm nâng cao giá trị của phần cứng. Đồng thời, mô hình phần cứng cũng có thể hỗ trợ phần mềm, ví dụ như máy dịch và máy văn phòng đều có một số ứng dụng mô hình lớn để nâng cao trải nghiệm, điều này không chỉ đơn thuần là kết nối API của mô hình lớn, mà còn tạo ra các chức năng độc đáo phù hợp với ngữ cảnh phần cứng.

Trong việc cung cấp dịch vụ cho bên ngoài, ông Liu Cong nhận thấy phạm vi ứng dụng của mô hình lớn đã dần mở rộng, ví dụ như lĩnh vực tài chính đã mở rộng sang các doanh nghiệp nhà nước. “Đối với các doanh nghiệp áp dụng mô hình lớn, giá trị sản phẩm quan trọng nhất là có thể giảm chi phí và tăng hiệu suất.”

Trong quá trình cung cấp dịch vụ cho thị trường B (doanh nghiệp), Tập đoàn iFlytek đã nhận ra các vấn đề như khó khăn trong việc thống nhất sức mạnh tính toán và quản lý dữ liệu toàn bộ. Ngoài ra, trong quá trình cung cấp dịch vụ cho bên ngoài, do nhiều doanh nghiệp là triển khai riêng, Tập đoàn iFlytek gặp khó khăn trong việc áp dụng mô hình cơ sở và phát triển tình huống. Để giải quyết vấn đề này, Tập đoàn iFlytek đã thông qua nền tảng thể trí tuệ (intelligent agent platform) như một dịch vụ.

“Logic của N phải được triển khai. Giai đoạn hiện tại khác với năm trước, khi 1+N của chúng tôi có phần dư thừa, cần tiếp tục được sắp xếp. Năm nay, sau khi chúng tôi sắp xếp rõ ràng N, sự phối hợp giữa 1 và N sẽ trở nên hệ thống hơn.”

Theo quan sát từ thực tế, ông Liu Cong đã tổng kết hai kinh nghiệm:

Thứ nhất, không cần thiết phải dành riêng cho “N”, có thể hợp nhất nó vào khả năng của “1”. Các khả năng thường xuyên sử dụng trong một tình huống có thể đáp ứng, hoặc trên cơ sở “1” có thể tạo ra một thể trí tuệ thông minh, hợp nhất vào “1” để giảm thiểu việc phát triển trùng lặp.

Thứ hai, thống nhất giao diện mô hình và giao diện dữ liệu. N ở đây có thể được dẫn dắt bởi các phòng ban kinh doanh, hoặc bởi viện nghiên cứu, nhưng nếu mỗi phòng ban trong một công ty có hệ thống đánh dấu dữ liệu khác nhau, việc hợp nhất chúng vào mô hình chính sẽ rất khó khăn. Sau khi hoàn thành giao diện mô hình, cần phải đánh dấu dữ liệu, dữ liệu SFT và dữ liệu học tập tăng cường, tạo thành một hệ thống kỹ thuật. Trong khung này, người dùng có thể tự tìm kiếm chuyên gia để đánh dấu, điều này không chỉ tối ưu hóa quy trình mà còn giúp dữ liệu N chảy ngược vào cơ sở dữ liệu.

Đối với “1” và “N” của Tập đoàn iFlytek trong năm nay, ông Liu Cong cho biết, “Dù là phát triển động, nhưng không thể bỏ qua. Nếu không tiến triển, sau ba tháng sẽ không ổn.”

Tuy nhiên, với sự tăng trưởng của quy mô mô hình, chu kỳ nghiên cứu sẽ dần kéo dài, do đó ông Liu Cong cho rằng công nghệ mô hình lớn sau này có thể không còn cuồng nhiệt như trước. “Mô hình cơ sở GPT-5 đòi hỏi nguồn lực khổng lồ, chu kỳ nâng cấp sẽ kéo dài hơn, các điểm sáng cục bộ có thể liên tục xuất hiện, nhưng rất khó có sự cải tiến lớn như từ GPT-3.5 đến GPT-4.”

Trong cuộc đua mô hình lớn, Tập đoàn iFlytek định vị mình là “có khả năng tổng thể ở hàng đầu, kiên nhẫn và bền bỉ trong lĩnh vực mình giỏi,” vì một vấn đề thực tế là mô hình hóa doanh nghiệp dễ bị đồng nhất, nhưng muốn làm tốt ở mọi lĩnh vực rất khó, ngay cả OpenAI và Google cũng không thể.

“Chúng tôi cần thời gian để người dùng quen với công nghệ, thông qua sản phẩm để rèn luyện sự kiên nhẫn của người dùng và khách hàng,” ông Liu Cong nói.

Trong kỷ nguyên thông minh này, công nghệ AI như dòng chảy mạnh mẽ tràn vào mọi ngành nghề, tái cấu trúc sâu sắc cách sản xuất và lối sống. Công nghệ mô hình lớn dẫn dắt đổi mới, nâng cao hiệu quả ngành một cách chính xác, từ giảng dạy cá nhân hóa đến marketing chính xác, từ truyền thông ổn định và hiệu quả đến quản lý rủi ro tài chính thông minh, AI không đâu không có mặt. Nó không chỉ là tiền phong trong cách mạng công nghệ, mà còn là động lực mạnh mẽ cho sự phát triển kinh tế xã hội. Dưới sự hỗ trợ của AI, chúng ta đang hướng tới một tương lai thông minh, tiện lợi và hiệu quả hơn, trải nghiệm những thay đổi cuộc sống và sự phát triển ngành chưa từng có.

 

Trong kỷ nguyên thông minh này, AI không chỉ là công nghệ mà còn là lực lượng mạnh mẽ thúc đẩy sự phát triển kinh tế xã hội. Công nghệ mô hình lớn không chỉ nâng cao hiệu quả ngành, mà còn mở ra một tương lai thông minh, tiện lợi và hiệu quả hơn. Hãy cùng dõi theo những thay đổi này và tận hưởng những trải nghiệm mới!

Từ khóa:

  • Mô hình lớn
  • Mô hình nhỏ
  • Trí tuệ nhân tạo
  • Phát triển phần cứng
  • Ứng dụng ngành
© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...