Thuần hóa mô hình lớn không kiểm soát, cần giải quyết những vấn đề gì? | Phỏng vấn Phó Giám đốc Wang Wenguang của Daguan Data.

công nghệ số5tháng trướccập nhật AIANT
41 00





Tìm hiểu về Khả năng Kiểm soát của Mô hình Lớn

Tìm hiểu về Khả năng Kiểm soát của Mô hình Lớn

Thuần hóa mô hình lớn không kiểm soát, cần giải quyết những vấn đề gì? | Phỏng vấn Phó Giám đốc Wang Wenguang của Daguan Data.

Trong hơn một năm kể từ khi GPT bùng nổ, không chỉ ở Việt Nam mà trên toàn thế giới, quan điểm cho rằng hầu hết các lĩnh vực đều cần được tái cấu trúc bằng mô hình lớn đã trở nên phổ biến. Tại Trung Quốc, hơn 200 nhà sản xuất đã tham gia vào cuộc đua “trăm mô hình”, tạo ra hàng loạt mô hình với hàng nghìn tỷ và hàng chục nghìn tỷ tham số. Sự phát triển nhanh chóng về hiệu suất và hướng ứng dụng đã chứng minh sức nóng của việc áp dụng mô hình lớn trong nhiều ngành công nghiệp. Tuy nhiên, khi nhiều ngành công nghiệp đang sẵn sàng thử nghiệm với mô hình lớn, cũng có nhiều vấn đề thực tế liên quan đến việc triển khai, trong đó vấn đề kiểm soát là một trong những vấn đề nổi bật.

Tại Hội nghị Toàn cầu AICon về Phát triển và Ứng dụng Trí tuệ Nhân tạo và Triển lãm Môi trường Ứng dụng Mô hình Lớn sắp diễn ra, InfoQ đã mời ông Vương Văn Quảng, Phó Chủ tịch của Công ty DataSun, tham gia trình bày và chia sẻ. Ông sẽ thảo luận về cách cải thiện khả năng giải thích, khả năng vận hành và khả năng kiểm soát của mô hình lớn thông qua việc kết hợp kỹ thuật RAG (Tăng cường tìm kiếm) và tri thức đồ thị. Trước hội nghị, InfoQ đã phỏng vấn ông Vương Văn Quảng để nghe ông chia sẻ về những khó khăn liên quan đến kiểm soát và đánh giá về các phương pháp kỹ thuật.

Tóm tắt cuộc phỏng vấn:

Vương Văn Quảng: Nội dung do mô hình lớn tạo ra dựa trên đầu vào của người dùng, được xác định bởi khả năng của mô hình. Việc kiểm soát chi tiết nội dung đầu ra là không thể. Điều này có nghĩa là, về bản chất, mô hình lớn không thể kiểm soát được. Về mặt thực tế, việc không thể kiểm soát mô hình lớn có thể được phân loại thành hai khía cạnh: nếu nội dung đầu ra phù hợp với mong đợi của người dùng thì đó là đáng tin cậy; nếu không, nó được gọi là ảo tưởng. Mặt khác, trong một số trường hợp, việc kiểm soát không phải lúc nào cũng cần thiết, ví dụ như viết tiểu thuyết hoặc kịch bản.

Ngoài ra, đối với người dùng Trung Quốc, có một số tình huống đòi hỏi mức độ kiểm soát cao. Ví dụ, đôi khi yêu cầu nội dung chính xác theo từng chữ. Tuy nhiên, kiểm soát và ảo tưởng là các khái niệm khác nhau. Ảo tưởng liên quan đến sự không khớp với sự thật, còn kiểm soát liên quan đến việc liệu nó có phù hợp với mong đợi hay không.

Khả năng Kiểm soát trong Các Ngành Nghề Khác Nhau

Vương Văn Quảng: Không thể nói đây là một rào cản hoàn toàn, mà phụ thuộc vào ngữ cảnh cụ thể. Chỉ trong một số trường hợp đòi hỏi mức độ kiểm soát cao, như trong ngành sản xuất hoặc tài chính, điều này mới trở thành một rào cản. Nói cách khác, yêu cầu chính xác của kết quả đầu ra càng cao, tác động của việc kiểm soát càng lớn.

Tôi cho rằng mục tiêu của mô hình lớn không phải là khả năng kiểm soát, mà là khả năng của mô hình. Mức độ trí tuệ hóa của mô hình và khả năng kiểm soát không liên quan mạnh mẽ. Mô hình lớn hơn không nhất thiết có khả năng kiểm soát tốt hơn, nhưng khả năng kiểm soát có thể được thực hiện bằng cách khác.

Cách Giải Quyết Vấn Đề Kiểm Soát

Vương Văn Quảng: Điều này chủ yếu phụ thuộc vào nhà cung cấp mô hình lớn, họ cần đảm bảo nội dung đầu ra tuân thủ các quy định, thói quen, quyền riêng tư và đạo đức địa phương.

Vương Văn Quảng: Có nhiều phương pháp, phương pháp phổ biến nhất là kỹ thuật RAG (Tăng cường tìm kiếm). Phương pháp này tìm kiếm thông tin cần thiết, sau đó đưa vào mô hình thông qua từ khóa. Một số phương pháp khác bao gồm phân tích đường dẫn kích hoạt trong mạng thần kinh, tuy nhiên, điều này khá phức tạp và tốn kém, do đó có thể không được sử dụng rộng rãi.

Phương Pháp Kết Hợp

Vương Văn Quảng: Phương pháp phổ biến nhất là RAG, đặc biệt trong ứng dụng. Tuy nhiên, RAG cũng có nhiều nội dung con. Đầu tiên là tìm kiếm trực tuyến, tìm kiếm đáp án thông qua công cụ tìm kiếm, sau đó đưa vào mô hình để tạo ra câu trả lời. Thứ hai là cơ sở dữ liệu vector, sử dụng phương pháp vector để tìm kiếm nội dung, nhưng so với tìm kiếm trực tuyến, nó có thể gặp vấn đề về hiệu suất và độ chính xác. Cuối cùng là đồ thị tri thức, lợi ích của nó là có cấu trúc tiền định, giúp tìm kiếm câu trả lời chính xác hơn, sau đó sử dụng mô hình lớn để tạo ra văn bản hợp lý.

Đồ Thị Tri Thức và Mô Hình Lớn

Vương Văn Quảng: Đồ thị tri thức và mô hình lớn có mối quan hệ bổ trợ. Về nguyên tắc, mô hình lớn tạo ra kết quả dựa trên quy luật tổng hợp, trong khi đồ thị tri thức dựa trên quy luật suy diễn. Từ góc độ thực tế, mô hình lớn tạo ra kết quả dựa trên xác suất, không thể kiểm soát chính xác và không thể chỉnh sửa nếu sai, trong khi đồ thị tri thức có thể chỉnh sửa.

Mặc dù vậy, xây dựng đồ thị tri thức có chi phí cao, đòi hỏi cấu trúc và logic phức tạp. Đây lại là những lĩnh vực mà mô hình lớn rất giỏi, ví dụ như sử dụng mô hình lớn để xây dựng đồ thị tri thức hoặc hiểu ngôn ngữ. Sự kết hợp của cả hai có thể tạo ra hệ thống thông minh và có thể áp dụng trong thực tế. Sự kết hợp giữa đồ thị tri thức và mô hình Cao Cấp Cao Cấp (Cao Cấp Cao Cấp) đã được chấp nhận rộng rãi trong ngành tài chính, sản xuất và năng lượng.

Định Hướng Phát Triển

Vương Văn Quảng: Hướng phát triển chính là chuyển đổi câu hỏi mở thành câu hỏi chọn, điều này đã được áp dụng rộng rãi trong việc triển khai mô hình Cao Cấp Cao Cấp.

Khó khăn trong Việc Triển Khai RAG

Vương Văn Quảng: Để triển khai mô hình lớn, RAG là không thể tránh khỏi, sử dụng phương pháp khác chỉ làm cho quá trình khó khăn hơn hoặc không đạt được hiệu quả mong muốn. Giới hạn cụ thể phụ thuộc vào phương pháp, mỗi hướng của RAG đều có những khó khăn riêng.

Giới hạn của tìm kiếm trực tuyến nằm ở sự phức tạp, một hệ thống tìm kiếm trực tuyến là một hệ thống phức tạp. Tìm kiếm vector dường như đơn giản, nhưng kiểm soát kém, không thể chỉnh sửa khi gặp vấn đề. Trong thực tế, chi tiết là ma quỷ, càng đi sâu vào, càng khó sử dụng. Đồ thị tri thức và tìm kiếm trực tuyến đều là hệ thống kiến thức phức tạp, học chúng rất khó khăn, và một đồ thị tri thức thường được xây dựng cho một ngành cụ thể, việc xây dựng một đồ thị tri thức toàn diện là rất khó.

Hiện tại, chúng tôi đang sử dụng tất cả ba phương pháp trong một hệ thống, mỗi phương pháp đều có nhược điểm riêng, do đó sử dụng phương pháp khác để bổ sung. Nếu chỉ biết một phương pháp, điểm tối đa chỉ là 60 điểm, thực sự rất khó để làm tốt.

Tương lai của Đồ Thị Tri Thức và Mô Hình Lớn

Vương Văn Quảng: Tôi cho rằng chúng sẽ không bao giờ thay thế nhau. Ví dụ, con người đã rất thông minh, nhưng khi cần kiến thức chuyên môn, vẫn cần tra cứu sách. Đối với mô hình lớn cũng vậy, nó không thể nhớ mọi thứ, đặc biệt là kiến thức chuyên môn, vì vậy tôi thường nói, đồ thị tri thức là cuốn bách khoa toàn thư cho mô hình lớn. Ngoài ra, mô hình lớn cũng cần được cập nhật, mô hình lớn hơn thì cập nhật chậm hơn và cần thời gian để huấn luyện.

Do đó, mô hình lớn luôn cần một cách để bổ sung thông tin, một lựa chọn tốt là cơ sở tri thức. Sách là bậc thang của sự tiến bộ con người, đồ thị tri thức là bậc thang của sự tiến bộ của mô hình lớn (trí tuệ nhân tạo).

Tác động lên Đồ Thị Tri Thức

Vương Văn Quảng: Tác động trực tiếp là, hiện nay với sự xuất hiện của mô hình lớn, một số hướng nghiên cứu về đồ thị tri thức đã không còn được thực hiện, ví dụ như hỏi đáp. Vì mô hình lớn đã làm rất tốt trong lĩnh vực này, việc kết hợp chúng có thể tạo ra hiệu quả tốt hơn. Do đó, người ta có thể tập trung nhiều hơn vào các hướng nghiên cứu khác của đồ thị tri thức, ví dụ như suy luận, đây cũng có thể là hướng nghiên cứu trong tương lai khi đồ thị tri thức và mô hình lớn được kết hợp.

Nâng cao Khả năng Mô Hình Lớn

Vương Văn Quảng: Hiện tại, tôi nghĩ rằng các phương pháp chính bao gồm ba phương pháp đã đề cập và tăng cường khả năng của mô hình lớn, ví dụ như huấn luyện mô hình cho ngành cụ thể. Điều này có thể thực hiện được nhưng chi phí cao, và trong các mô hình ngôn ngữ, mọi người dường như không làm nhiều, có lẽ do hiệu quả chưa cao.

Độ Chính Xác và Kiểm Soát

Vương Văn Quảng: Tôi nghĩ rằng việc chỉ dựa vào mô hình lớn là rất khó, có thể mãi không đạt được kỳ vọng, cần kết hợp với các phương pháp đã đề cập. Bởi vì mô hình lớn dù giỏi đến đâu, nếu dữ liệu huấn luyện không chứa thông tin liên quan (ví dụ như sự kiện mới xảy ra), thì chắc chắn sẽ không thể trả lời đúng. Ví dụ, hiện tại (8 tháng 5 năm 2024) nếu hỏi mô hình lớn không có RAG về nội dung liên quan đến Phi thuyền Chang’e 6, chắc chắn sẽ nhận được câu trả lời không chính xác.

Chia sẻ trong Hội Nghị

Vương Văn Quảng: Tôi sẽ trình bày hai phần, cũng là những phần mà mọi người quan tâm. Đầu tiên là cách giải quyết vấn đề kiểm soát, chúng tôi sẽ kết hợp tìm kiếm trực tuyến, đồ thị tri thức và cơ sở dữ liệu vector. Thứ hai là những trường hợp thực tế mà chúng tôi đang thực hiện, vì hiện nay vấn đề lớn nhất của mô hình lớn là việc triển khai.

Về Người Phỏng Vấn

Vương Văn Quảng: Hiện nay giữ chức Phó Chủ tịch của Công ty DataSun, đồng thời là Kỹ sư Cao cấp. Ông là một trong những nhân vật ưu tú của Kế hoạch Kim Cương ở Phố Đông, đã nhận được nhiều giải thưởng về tiến bộ khoa học và công nghệ. Ông là chuyên gia biên soạn chuẩn mực trí tuệ nhân tạo, tác giả của cuốn sách “Tri thức Đồ thị: Lý thuyết và Thực hành Trí tuệ Nhận thức”. Ông cũng là cố vấn và tác giả của một số bài viết về trí tuệ nhân tạo.

Từ Khóa

  • Trí tuệ Nhân tạo
  • Mô hình Lớn
  • Kiểm soát
  • RAG
  • Đồ thị Tri thức


© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...