Lin Yun từ Đại học Giao thông Thượng Hải: Khám phá khả năng giải thích và minh bạch của mô hình lớn, tương lai của lập trình AI ở đây!

Trong thế giới phát triển phần mềm, việc tạo ra, chỉnh sửa, kiểm thử và gỡ lỗi mã nguồn luôn là những hoạt động cốt lõi. Tuy nhiên, với sự xuất hiện của các mô hình ngôn ngữ lớn, những hoạt động này đang trải qua một cuộc cách mạng sâu sắc. Cuộc cách mạng này không chỉ nâng cao hiệu quả phát triển mà còn mang đến những thách thức và vấn đề mới. Trong hai ngày 18-19 tháng 8, hội nghị AICon tại Thượng Hải vinh dự được mời giáo sư Lin Yun từ Khoa Khoa học Máy tính và Kỹ thuật tại Đại học Giao thông Thượng Hải, người sẽ thảo luận về cách mô hình ngôn ngữ ảnh hưởng đến từng giai đoạn trong quá trình phát triển phần mềm và sẽ trình bày cách sử dụng các kỹ thuật phân tích tiên tiến để tối ưu hóa và tăng cường khả năng dự đoán của mô hình.

Bài viết này là bài phỏng vấn trước hội nghị, trong đó ông đã đi sâu vào việc ứng dụng mô hình ngôn ngữ lớn trong phát triển phần mềm, chia sẻ chiến lược cải thiện độ giải thích của mô hình, như công nghệ trực quan hóa và hàm ảnh hưởng. Qua trường hợp ISSTA’24, ông đã trình bày phương pháp chỉnh sửa tương tác toàn dự án và thảo luận về việc áp dụng công nghệ song sinh số để xác minh khả năng của mô hình; cuối cùng, ông dự đoán ảnh hưởng của AI đối với mô hình phát triển phần mềm và nhấn mạnh rằng các nhà phát triển cần có kỹ năng mới trong thời đại AI. Chúng tôi hy vọng bài viết này sẽ truyền cảm hứng cho bạn.

Ngoài ra, trong hai ngày 18-19 tháng 8, hội nghị AICon Toàn cầu về Phát triển và Ứng dụng AI sẽ diễn ra tại Thượng Hải, tập trung vào các chủ đề hàng đầu như AI bên cạnh thiết bị, huấn luyện mô hình lớn, thực hành an ninh mô hình lớn, ứng dụng RAG, và đổi mới đa phương thức. Chi tiết xem tại liên kết gốc.

Lin Yun: Các phương pháp tự động hóa cho các tác vụ kỹ thuật phần mềm thường gặp khó khăn do thiếu kiến thức chuyên ngành hoặc lĩnh vực cụ thể, ví dụ như việc thu thập tài nguyên tệp tin cụ thể hoặc xác định nguyên nhân của lỗi hoặc ngoại lệ cụ thể; mô hình ngôn ngữ đã khắc phục điều này bằng cách nén và mã hóa lượng kiến thức lập trình khổng lồ, giúp lấp đầy khoảng cách “kiến thức” này. Nhóm nghiên cứu của chúng tôi đã hợp tác với ByteDance để khám phá phương pháp chỉnh sửa mã tự động dựa trên mô hình ngôn ngữ, nhằm giải quyết các vấn đề như lan truyền chỉnh sửa, định vị, tạo và vòng lặp phản hồi.
Hiện tại, độ chính xác trong việc định vị và tạo đã đạt được kết quả tương đối lý tưởng; đối với kiểm thử, chúng tôi đang cố gắng để mô hình ngôn ngữ tiếp tục học kiến thức lĩnh vực để tạo ra các bộ kiểm thử liên quan đến lĩnh vực; đối với gỡ lỗi, chúng tôi cũng mong muốn mô hình tạo ra toàn bộ quy trình gỡ lỗi, nhờ đó công nghệ trở nên thực tế hơn.

Lin Yun: Ưu điểm của mô hình ngôn ngữ nằm ở việc nó sở hữu lượng kiến thức thông thường lớn, có thể giải quyết và tổng hợp các giải pháp dựa trên lượng kiến thức thông thường khổng lồ. Hạn chế của nó nằm ở việc suy luận xác định về ngữ cảnh dài (ví dụ: phân tích dòng chảy dữ liệu xuyên qua nhiều tệp). Do đó, nếu có thể kết hợp mô hình ngôn ngữ và các công cụ phân tích chương trình truyền thống một cách hiệu quả, đây sẽ là một đề tài rất đáng giá.

Lin Yun: Vấn đề giải thích chính yếu nằm ở việc phân tích biểu diễn mã và quyên thuộc mẫu huấn luyện. Phân tích biểu diễn thực chất là hiểu xem mô hình có thể hiểu được ngữ nghĩa tương tự giữa hai đoạn mã hay không, đây là khả năng tổng hợp mô hình rất quan trọng. Đối với quyên thuộc mẫu huấn luyện, mục đích là giải quyết xem dự đoán của mô hình đến từ mẫu huấn luyện nào, điều này rất quan trọng đối với chất lượng bộ dữ liệu.

Đối với vấn đề đầu tiên, chúng tôi đã phát triển công nghệ trực quan hóa không gian biểu diễn để hiểu quá trình huấn luyện của mô hình; đối với vấn đề thứ hai, chúng tôi đã tối ưu hóa hàm ảnh hưởng truyền thống (Influence Function), để theo dõi sự đóng góp và xung đột giữa các mẫu huấn luyện.

Lin Yun: Deep learning về cơ bản là học biểu diễn, bất kỳ mẫu nào cũng sẽ có một biểu diễn vectơ trong không gian vectơ đa chiều. Hiện tại, chúng tôi đang chuyển đổi các sự kiện huấn luyện xảy ra trong không gian biểu diễn thành một animation tương tác, để quan sát quá trình huấn luyện.

Trong quá trình này, chúng tôi có thể quan sát sự thay đổi khoảng cách ngữ nghĩa giữa các mẫu và sử dụng hàm ảnh hưởng (một phương pháp giải thích dựa trên dữ liệu) để suy luận nguyên nhân của sự thay đổi này. Việc sử dụng kết hợp các phương pháp giải thích này trong thực tế có thể giúp chúng tôi phân tích chất lượng dữ liệu huấn luyện, khả năng biểu diễn của mô hình, và một số vấn đề trong việc đánh dấu dữ liệu huấn luyện.

Lin Yun: Công việc ISSTA’24 của chúng tôi đã đề xuất một phương pháp chỉnh sửa mã toàn diện, gọi là CoEdPilot. Khi người dùng đưa ra yêu cầu chỉnh sửa, công cụ của chúng tôi có thể hoàn thành việc chỉnh sửa toàn dự án và tạo mã một cách lặp lại. Đồng thời, thông qua việc sử dụng chỉnh sửa trước đó như phản hồi của người dùng, chúng tôi tiếp tục điều chỉnh và tinh chỉnh kết quả định vị và tạo.

Chúng tôi đã thiết kế hai mô hình Transformer để chia nhỏ một nhiệm vụ toàn diện thành hai mô hình nhỏ hơn, để hoàn thành nhiệm vụ này một cách tương tác. Một mô hình ngôn ngữ nhỏ được sử dụng để định vị chỉnh sửa, và mô hình ngôn ngữ nhỏ khác được sử dụng để tạo chỉnh sửa. Chúng tôi đã thu thập lịch sử chỉnh sửa mã lớn để huấn luyện lại hai mô hình này, để đạt được kết quả tốt hơn. Thông tin chi tiết hơn có thể xem tại chia sẻ của AICon Thượng Hải.

Lin Yun: Chúng tôi đã thiết kế hàm ảnh hưởng của riêng mình để lần theo nguồn gốc của một dự đoán trở lại mẫu huấn luyện đóng góp lớn nhất. Ý tưởng cơ bản ở đây là phân tích sự liên kết dự đoán giữa một mẫu huấn luyện và một mẫu kiểm tra để hoàn thành điều này. Đối với tình huống xác minh song sinh số, chúng tôi mong muốn khôi phục trạng thái chỉnh sửa mã động từ một trạng thái nộp mã tĩnh, để xác minh khả năng của mô hình.

Lin Yun: Vấn đề chính giải quyết ở đây là độ chính xác huấn luyện mô hình không tương đương với năng suất lập trình thực tế của mô hình, vì vậy chúng tôi đã thiết kế công nghệ này để giải quyết khoảng cách này. Như đã nói ở trên, chúng tôi khôi phục trạng thái chỉnh sửa mã động từ một trạng thái nộp mã tĩnh để xác minh thêm khả năng của mô hình.

Lin Yun: Qua các công nghệ giải thích này, chúng tôi hy vọng sẽ giúp các lập trình viên hiểu rõ quá trình huấn luyện mô hình. Ví dụ, thông qua quyên thuộc dữ liệu huấn luyện, người dùng có thể hiểu rõ hơn về cơ sở ra quyết định của mô hình, nhờ đó họ có thể dễ dàng chấp nhận hoặc từ chối đề xuất của mô hình.

Lin Yun: Sự nhúng của mô hình ngôn ngữ vào các hoạt động phát triển phần mềm là xu hướng tất yếu. Trước đây, một số kiến thức về phát triển mã có thể được truyền miệng giữa các lập trình viên; sau khi có mô hình ngôn ngữ, mọi người sẽ dần nghĩ đến việc lưu lại nhiều lịch sử phát triển mã hơn và đào tạo các mô hình tương ứng để hoàn thành việc đề xuất. Vì vậy, trong tương lai, hoạt động phát triển mã cũng đồng thời là hoạt động đánh dấu dữ liệu, điều này có thể dẫn đến sự suy ngẫm và đổi mới trong việc phát triển hướng tới mô hình.

Lin Yun: Tôi nghĩ rằng các nhà phát triển có thể cần hiểu nguyên lý hoạt động của mô hình AI đến một mức độ nào đó. Vì việc giao hàng phần mềm đáng tin cậy vẫn là yêu cầu không thay đổi, nhưng nếu giao việc này cho một mô hình ngôn ngữ dựa trên xác suất, mặt khác cần có cơ chế kiểm tra mạnh mẽ để kiểm tra độ tin cậy của kết quả mô hình xác suất; mặt khác cần hiểu các hạn chế của mô hình ngôn ngữ. Điều này sẽ giúp có cách hợp tác con người-máy tính tốt hơn để giao hàng các sản phẩm phần mềm đáng tin cậy hơn.

Lin Yun, phó giáo sư Khoa Khoa học Máy tính và Kỹ thuật tại Đại học Giao thông Thượng Hải, trợ lý trưởng khoa, và hướng dẫn viên tiến sĩ, từng là giảng viên trợ lý (nghiên cứu) tại Đại học Quốc gia Singapore, được chọn vào danh sách năm 2021 của Chương trình Nhân tài Trẻ Quốc tế. Ông chủ yếu nghiên cứu trong lĩnh vực kỹ thuật phần mềm, tập trung vào công nghệ phân tích tự động mã, trang web và mô hình AI. Ông đã công bố gần 50 bài báo trên các hội nghị và tạp chí quốc tế hàng đầu. Ông từng là đồng chủ tịch chương trình PRDC2023, và là ủy viên chương trình và nhà xem xét của các hội nghị quốc tế quan trọng, đã chủ trì dự án thanh niên ưu tú của NSFC (nước ngoài), và đã giành giải thưởng bài báo tốt nhất tại ICSE2018.

Trong hai ngày 18-19 tháng 8, hội nghị AICon Toàn cầu về Phát triển và Ứng dụng AI sẽ diễn ra tại Thượng Hải. 60+ chuyên gia hàng đầu từ các công ty và tổ chức nghiên cứu hàng đầu như ByteDance, Huawei, Alibaba, Microsoft Asia Research Institute, Zhiyuan Institute of Artificial Intelligence, Shanghai Artificial Intelligence Laboratory, NIO, Xiaohongshu, Zero One Wonders sẽ mang đến chia sẻ về các trường hợp và thực hành tốt nhất trong lĩnh vực AI và mô hình lớn, giúp người tham dự nâng cao tầm nhìn kỹ thuật và nhận được hướng dẫn thực hành có giá trị. Hội nghị đang mở cửa đăng ký, chi tiết xem liên hệ với quản lý vé 13269078023.

Trong kỷ nguyên thông minh này, công nghệ AI đang tràn ngập vào mọi ngành công nghiệp, tái cấu trúc sâu sắc cách sản xuất và lối sống. Công nghệ mô hình lớn dẫn dắt đổi mới, nâng cao hiệu quả ngành một cách chính xác, từ giảng dạy cá nhân hóa đến tiếp thị chính xác, từ truyền thông ổn định và hiệu quả đến quản lý rủi ro tài chính thông minh, AI không thể thiếu. Nó không chỉ là người tiên phong của sự đổi mới công nghệ, mà còn là lực đẩy mạnh mẽ cho sự phát triển kinh tế xã hội. Dưới sự hỗ trợ của AI, chúng ta đang hướng tới một tương lai thông minh, tiện lợi và hiệu quả hơn, trải nghiệm những sự thay đổi cuộc sống và ngành công nghiệp chưa từng có. Hãy theo dõi trang “AI Frontline” và trả lời “nghành trăm nghề” để nhận tài liệu trường hợp miễn phí.

Bạn cũng “xem” không?

**Từ khóa:**
– Mô hình ngôn ngữ lớn
– Phát triển phần mềm
– AICon
– Giải thích mô hình
– Song sinh số

công nghệ số

Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.

Những bài viết liên quan:

Yi-VL, mô hình ngôn ngữ đa mô thức do Zero One phát hành và mã nguồn mở, đánh giá chỉ sau GPT-4V.

công nghệ số

10tháng trước

0740

Đội ngũ mô hình lớn của Xiaohongshu khám phá và thực hành: Từ 0 đến 1 xây dựng khung RLHF tự phát triển.

công nghệ số

10tháng trước

0770

Alibaba Cloud công bố mô hình mã nguồn mở Qwen2, hiệu suất vượt trội hơn Llama3-70 và nhiều mô hình đóng khác trong nước.

công nghệ số

10tháng trước

0950

Các nhà khoa học kỳ cựu của OpenAI đều đã rời bỏ! Một kỷ nguyên đã kết thúc?

công nghệ số

10tháng trước

0700

Chưa có đánh giá nào

Không có đánh giá...

Lin Yun từ Đại học Giao thông Thượng Hải: Khám phá khả năng giải thích và minh bạch của mô hình lớn, tương lai của lập trình AI ở đây!

Các mô hình tạo hình ảnh như Flux và SD bị "cấm", nhưng lần này các công ty lớn ở Silicon Valley không phản đối!

Stable Diffusion 3.0 cùng cấu trúc với Sora ra mắt mạnh mẽ! Tạo video 4 giây nhưng gặp sự cố, người dùng mạng: Vẫn nên chờ Sora!

Những bài viết liên quan:

Yi-VL, mô hình ngôn ngữ đa mô thức do Zero One phát hành và mã nguồn mở, đánh giá chỉ sau GPT-4V.

Đội ngũ mô hình lớn của Xiaohongshu khám phá và thực hành: Từ 0 đến 1 xây dựng khung RLHF tự phát triển.

Alibaba Cloud công bố mô hình mã nguồn mở Qwen2, hiệu suất vượt trội hơn Llama3-70 và nhiều mô hình đóng khác trong nước.

Các nhà khoa học kỳ cựu của OpenAI đều đã rời bỏ! Một kỷ nguyên đã kết thúc?

Chưa có đánh giá nào

Tin tức mới nhất

Lin Yun từ Đại học Giao thông Thượng Hải: Khám phá khả năng giải thích và minh bạch của mô hình lớn, tương lai của lập trình AI ở đây!

Các mô hình tạo hình ảnh như Flux và SD bị "cấm", nhưng lần này các công ty lớn ở Silicon Valley không phản đối!

Stable Diffusion 3.0 cùng cấu trúc với Sora ra mắt mạnh mẽ! Tạo video 4 giây nhưng gặp sự cố, người dùng mạng: Vẫn nên chờ Sora!

Những bài viết liên quan:

Yi-VL, mô hình ngôn ngữ đa mô thức do Zero One phát hành và mã nguồn mở, đánh giá chỉ sau GPT-4V.

Đội ngũ mô hình lớn của Xiaohongshu khám phá và thực hành: Từ 0 đến 1 xây dựng khung RLHF tự phát triển.

Alibaba Cloud công bố mô hình mã nguồn mở Qwen2, hiệu suất vượt trội hơn Llama3-70 và nhiều mô hình đóng khác trong nước.

Các nhà khoa học kỳ cựu của OpenAI đều đã rời bỏ! Một kỷ nguyên đã kết thúc?

Chưa có đánh giá nào

Tin tức mới nhất

Nhãn

Nhãn