Xây dựng tương lai của các tác nhân thông minh, Song Kaitao từ Microsoft tiết lộ hệ thống JARVIS và triển vọng ứng dụng của nó trong lĩnh vực AI.

công nghệ số5tháng trướccập nhật AIANT
42 00
Xây dựng tương lai của các tác nhân thông minh, Song Kaitao từ Microsoft tiết lộ hệ thống JARVIS và triển vọng ứng dụng của nó trong lĩnh vực AI.

Trong kỷ nguyên thông minh này, công nghệ trí tuệ nhân tạo (AI) đang tràn ngập mọi lĩnh vực của cuộc sống và sản xuất, sâu sắc thay đổi cách chúng ta sống và làm việc. Công nghệ mô hình lớn dẫn đầu trong việc đổi mới, tăng cường hiệu quả ngành nghề một cách chính xác, từ giảng dạy cá nhân hóa trong giáo dục đến tiếp thị chính xác trong bán lẻ, từ sự ổn định và hiệu quả trong giao tiếp đến rủi ro tài chính thông minh trong tài chính, AI có mặt ở khắp mọi nơi. Nó không chỉ là người tiên phong trong việc cải tiến công nghệ mà còn là lực lượng mạnh mẽ thúc đẩy sự phát triển kinh tế-xã hội. Dưới sự hỗ trợ của AI, chúng ta đang hướng tới một tương lai thông minh, tiện lợi và hiệu quả hơn, trải nghiệm sự biến đổi cuộc sống và phát triển ngành nghề chưa từng có.

Tại AICon Thượng Hải vào ngày 18-19 tháng 8, chúng tôi đã lên kế hoạch cho diễn đàn “Công nghệ đột phá và ứng dụng của AI Agent”. Chúng tôi rất vinh dự được mời ông Tào Songcai, nghiên cứu viên cao cấp tại Viện Nghiên cứu Châu Á Thái Bình Dương của Microsoft, sẽ trình bày bài nói chuyện “Thời đại tương lai đã ở đây, Khám phá sâu về các tác nhân tự hành”. Qua chia sẻ của ông, bạn sẽ hiểu rõ các thành phần cần cân nhắc khi xây dựng tác nhân thông minh và hiểu rõ hơn về các vấn đề hiện tại trong việc xây dựng tác nhân thông minh.

Xây dựng tương lai của các tác nhân thông minh, Song Kaitao từ Microsoft tiết lộ hệ thống JARVIS và triển vọng ứng dụng của nó trong lĩnh vực AI.

Bài viết này là bài phỏng vấn trước buổi thuyết trình của ông Tào Songcai. Ông Tào Songcai cho biết hệ thống JARVIS là một công cụ lập lịch thông minh dựa trên mô hình ngôn ngữ lớn, có khả năng hợp tác với nhiều mô hình AI chuyên gia khác nhau để xử lý các tác vụ phức tạp. Mặc dù nó vẫn đang trong giai đoạn sơ khai, nhưng nó đã thể hiện tiềm năng trong việc xử lý đa phương thức và sử dụng công cụ. Đối mặt với thách thức khi mở rộng chức năng, JARVIS sử dụng cấu trúc phân cấp để tối ưu hóa việc lập lịch mô hình. Trong tương lai, JARVIS sẽ tiếp tục phát triển, mục tiêu là xây dựng hệ thống tác nhân đơn thể và đa tác nhân mạnh mẽ hơn, và có thể thiết lập một thư viện ứng dụng tác nhân.

Dưới đây là nội dung phỏng vấn:

Ông Tào Songcai: Lõi của hệ thống JARVIS, dựa trên mô hình lớn, được sử dụng như một trung tâm thần kinh quản lý, thông qua việc giới thiệu khả năng lập kế hoạch tác vụ, cơ chế lựa chọn và các mô-đun khác để thực hiện việc điều phối các mô hình chuyên gia khác nhau. Trong đó, chúng tôi sẽ chọn cộng đồng học máy như Hugging Face để cung cấp các mô hình chuyên gia. So với các tác nhân thông minh hiện nay, JARVIS là một công trình rất sớm, thuộc một kiến trúc tác nhân sớm. Công việc hiện tại có thể hoàn thiện hơn, bao gồm việc giới thiệu cơ chế tác nhân đa thể và thiết kế gợi ý tinh vi hơn cũng như cơ chế bộ nhớ.

Ông Tào Songcai: JARVIS cũng là quan sát của chúng tôi về mô hình lớn. Từ khi ra đời của ChatGPT vào cuối năm 2022, chúng tôi cũng quan sát khả năng ngôn ngữ của mô hình lớn thực sự mạnh đến đâu. Nếu khả năng ngôn ngữ đủ mạnh, thì mô hình lớn nên có khả năng nắm bắt ngôn ngữ như con người. Do đó, nếu chúng ta cung cấp mô hình AI, các mô hình chuyên gia AI sẽ sử dụng như thế nào, thì mô hình lớn nên có khả năng điều phối, hợp tác và sử dụng nó. Do đó, chúng tôi cung cấp mô tả mô hình AI dưới dạng gợi ý cho mô hình lớn, để chỉ ra cho mô hình lớn trong tình huống nào cần sử dụng nó. Đồng thời, chúng tôi yêu cầu nó có thể phân giải tác vụ, đánh giá sự phụ thuộc giữa các tác vụ. Điều này cho phép kịch bản điều phối hợp tác giữa các mô hình chuyên gia AI.

Ông Tào Songcai: Cụ thể, chúng tôi đầu tiên sử dụng khả năng lập kế hoạch tác vụ của mô hình ngôn ngữ lớn để phân tích nhu cầu của người dùng và phân giải tác vụ thành các tác vụ con, để nhận được chuỗi tác vụ và sự phụ thuộc lẫn nhau giữa các tác vụ. Sau đó, dựa trên chuỗi tác vụ mà chúng tôi nhận được, chúng tôi sử dụng một cơ chế chọn mô hình để chọn mô hình phù hợp nhất giải quyết tác vụ tương ứng. Cuối cùng, chúng tôi sẽ thực hiện và điều phối các mô hình này để tạo ra đầu ra mô hình cuối cùng.

Ông Tào Songcai: Tôi nghĩ có một số khó khăn chính: 1) Nếu chúng tôi muốn hệ thống có chức năng mạnh mẽ hơn, chúng tôi có thể cần điều phối nhiều mô hình hơn. Nếu những mô hình này được xây dựng dưới dạng gợi ý, điều này sẽ tiêu tốn nhiều ngữ cảnh; 2) Cách lập kế hoạch chính xác chuỗi tác vụ cũng là một thách thức lớn. Nếu dự đoán chuỗi tác vụ sai, điều này cũng sẽ ảnh hưởng đến việc tạo ra sau này của hệ thống. Cách sửa chữa và cải tiến kịp thời rất quan trọng.

Ông Tào Songcai: Thực tế, như một tác nhân đại diện cho công cụ lập lịch, anh ấy cần rất nhiều chức năng thông minh để tạo ra. Đại diện bởi cộng đồng học máy nguồn mở (Hugging Face, ví dụ trong nước như Modelscope), chúng ta có thể tạo ra một tác nhân thông minh có khả năng xử lý ngôn ngữ, giọng nói, hình ảnh, thị giác và các phương thức khác bằng cách xây dựng việc điều phối đối với các mô hình khác nhau. Ngoài ra, bao gồm cả việc sử dụng các công cụ như dự báo thời tiết, tính toán toán học, tất cả đều có thể tạo ra tác nhân thông minh mạnh mẽ hơn. Do đó, khi chúng ta cần mở rộng phạm vi tác vụ của mô hình ngôn ngữ, tác nhân như JARVIS sẽ có nhiều ứng dụng.

Ông Tào Songcai: Trên thực tế, những vấn đề này liên quan đến cơ chế mà chúng tôi đã đề cập, đó là khi chúng ta muốn xây dựng tác nhân thông minh mạnh mẽ hơn, chúng ta phải giới thiệu nhiều mô hình chuyên gia hoặc công cụ hơn. Khi chúng ta cần mở rộng quy mô của những công cụ này, chúng sẽ đặt gánh nặng lên mô hình. Vì vậy, cách điều phối hàng loạt công cụ sẽ là một thách thức lớn. Hiện tại, chúng tôi sẽ sử dụng cấu trúc phân cấp, nghĩa là thể hiện công cụ dưới dạng cấu trúc cây để phân phối và điều phối.

Ông Tào Songcai: Tôi nghĩ có một số điểm chính: 1) Làm thế nào để xây dựng tác nhân đơn thể mạnh mẽ; 2) Trên cơ sở tác nhân đơn thể, xây dựng tác nhân đa thể; 3) Có thể xây dựng thư viện cộng đồng tương ứng cho tác nhân, giống như App Store. Những điều này đều rất quan trọng.

Ông Tào Songcai: Trên thực tế, tôi vẫn sẽ tập trung vào JARVIS / HuggingGPT. Tôi cũng có thể thảo luận về nghiên cứu mở rộng tác nhân hiện tại, bao gồm từ góc độ hiệu suất, tự cải thiện, đánh giá, cách xây dựng tác nhân tin cậy và đáng tin cậy tốt hơn.

Tào Songcai, nghiên cứu viên cao cấp tại Viện Nghiên cứu Châu Á Thái Bình Dương của Microsoft, tốt nghiệp tiến sĩ từ Đại học Khoa học và Công nghệ Nam Kinh. Nghiên cứu của ông tập trung vào xử lý ngôn ngữ tự nhiên, mô hình ngôn ngữ lớn và tác nhân AI. Ông đã công bố hơn 40 bài báo quốc tế tại các hội nghị và tạp chí học thuật, bao gồm NeurIPS, ICML, ICLR, ICCV, ACL, EMNLP, KDD, AAAI, IJCAI, và đồng thời là người đánh giá cho nhiều hội nghị và tạp chí học thuật. Công trình đại diện của ông bao gồm nghiên cứu về tác nhân như HuggingGPT và đào tạo mô hình cơ bản như MASS, MPNet.

Tại Hội nghị AICon toàn cầu về Phát triển và Ứng dụng AI vào ngày 18-19 tháng 8, hơn 60 chuyên gia kỳ cựu từ các công ty và tổ chức hàng đầu như ByteDance, Huawei, Alibaba, Viện Nghiên cứu Châu Á Thái Bình Dương của Microsoft, Viện Nghiên cứu Bắc Kinh, Phòng thí nghiệm AI Thượng Hải, NIO, Xiaohongshu, Zero One Wonders sẽ tụ họp để chia sẻ các trường hợp và thực tiễn tốt nhất về việc áp dụng AI và mô hình lớn trong các tình huống cụ thể. Sự kiện này đang nhận đăng ký sôi nổi, chi tiết xem thêm tại [đường link đọc thêm] hoặc liên hệ với quản lý vé 13269078023 để được tư vấn.

Xây dựng tương lai của các tác nhân thông minh, Song Kaitao từ Microsoft tiết lộ hệ thống JARVIS và triển vọng ứng dụng của nó trong lĩnh vực AI.
Xây dựng tương lai của các tác nhân thông minh, Song Kaitao từ Microsoft tiết lộ hệ thống JARVIS và triển vọng ứng dụng của nó trong lĩnh vực AI.

Bạn cũng “đọc” nó không?

**Từ khóa:** Trí tuệ nhân tạo, Tác nhân thông minh, Mô hình lớn, Hệ thống JARVIS, AICon

© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...