Phiên bản nội địa của Sora đã đến! Mô hình video lớn tiến thêm một bước | Tin tức tuần về mô hình lớn.

công nghệ số5tháng trướccập nhật AIANT
45 00





Tin tức tuần qua về Trí tuệ nhân tạo

Trí tuệ nhân tạo: Một tuần đầy sự kiện

Phiên bản nội địa của Sora đã đến! Mô hình video lớn tiến thêm một bước | Tin tức tuần về mô hình lớn.

Ngành công nghiệp trong tuần này đã chứng kiến ​​sự phát triển mạnh mẽ về công nghệ, tối ưu hóa mô hình, ứng dụng liên ngành và nghiên cứu khoa học. Mô hình Video Vidu, mô hình dự đoán đa token và gpt2-chatbot đều thể hiện hiệu suất đột phá. Công ty Yuanxiang đã mở nguồn mô hình đa mô thức XVERSE-V, Alibaba Cloud đã công bố mô hình Qwen1.5-110B với 110 tỷ tham số, thúc đẩy chia sẻ và tiến bộ của công nghệ AI.

Công nghệ PEFT và cấu trúc mạng thần kinh KAN đã được đề xuất, mang lại hướng mới cho việc huấn luyện và thiết kế cấu trúc mô hình lớn. Anthropic đã ra mắt ứng dụng iOS của mô hình Claude, và GitHub đã giới thiệu Copilot Workspace, tăng cường khả năng sử dụng AI trên nền tảng di động và môi trường phát triển.

Một số điểm nổi bật:

  • Vidu: Được công bố vào ngày 27 tháng 4 bởi Shengshuju và Đại học Thanh Hoa, Vidu là mô hình video đầu tiên ở Trung Quốc có khả năng dài hạn, nhất quán và động lực cao. Vidu có thể mô phỏng hiện tượng vật lý thực tế và hỗ trợ nhiều ống kính, đồng thời đạt được độ nhất quán không gian-thời gian cao. Nó sử dụng cấu trúc U-ViT độc đáo kết hợp giữa Diffusion và Transformer, cho phép tạo ra nội dung video chất lượng cao với độ phân giải 1080P trong 16 giây.
  • gpt2-chatbot: Vào ngày 30 tháng 4, một mô hình chatbot tên gpt2-chatbot đã thu hút sự chú ý trên mạng xã hội. Nhiều người dùng đã kiểm tra và nhận thấy khả năng của nó không kém so với GPT-4, thậm chí còn vượt trội hơn trong một số tác vụ.
  • Mô hình dự đoán đa token: Đội ngũ Meta AI Pháp đã giới thiệu mô hình dự đoán đa token vào ngày 30 tháng 4, đặc biệt hiệu quả trong các tác vụ lập trình. Với mô hình 13 tỷ tham số, nó đã giải quyết 12% vấn đề bổ sung trên chuẩn benchmark HumanEval và 17% vấn đề bổ sung trên chuẩn benchmark MBPP. Ngoài ra, mô hình này cũng cho thấy thành tựu đáng kể trong việc suy luận thuật toán nhỏ và tổng quát hóa ngoài phân phối.
  • XVERSE-V: Công ty Yuanxiang đã công bố và mở nguồn mô hình đa mô thức XVERSE-V vào ngày 28 tháng 4, cho phép sử dụng không điều kiện và thương mại miễn phí.
  • Qwen1.5-110B: Vào ngày 29 tháng 4, Alibaba Cloud đã công bố mô hình Qwen1.5-110B với 110 tỷ tham số, đạt thành tích tốt nhất hiện tại trong nhiều bài kiểm tra chuẩn. Mô hình này kế thừa kiến trúc giải mã Transformer từ Qwen1.5 và giới thiệu phương pháp chú ý nhóm truy vấn, giúp mô hình hoạt động hiệu quả hơn trong quá trình suy luận. Qwen1.5-110B hỗ trợ ngữ cảnh lên đến 32K và xử lý tốt nhiều ngôn ngữ khác nhau.
  • Awaker 1.0: Công ty Zizijiqi đã công bố mô hình đa mô thức Awaker 1.0 vào ngày 27 tháng 4, sử dụng kiến trúc MOE sáng tạo và có khả năng cập nhật tự động. Trong việc tạo video, Awaker 1.0 sử dụng nền tảng tạo video VDT do công ty tự phát triển, vượt qua Sora trong việc tạo video chân thực.
  • PEFT: Nhóm nghiên cứu từ Đại học Northeastern, Đại học California Riverside, Đại học Arizona State và Đại học New York đã khám phá ứng dụng và hướng phát triển của công nghệ PEFT trong việc huấn luyện mô hình lớn vào ngày 29 tháng 4. Công nghệ này cung cấp một cách hiệu quả để thích ứng mô hình tiền huấn luyện cho các tác vụ cụ thể.
  • KAN: Nhóm nghiên cứu từ MIT, Caltech, và Đại học Northeastern đã công bố cấu trúc mạng thần kinh KAN vào ngày 30 tháng 4, một cấu trúc hoàn toàn mới so với MLP truyền thống. KAN cho phép đạt được độ chính xác cao hơn với ít tham số hơn trong việc giải quyết các vấn đề toán học và vật lý. Nó cũng tránh được vấn đề quên triệt tiêu trong quá trình xử lý mô hình lớn và dễ dàng tích hợp kiến thức chuyên ngành.
  • Copilot Workspace: GitHub đã ra mắt phiên bản kỹ thuật xem trước của Copilot Workspace vào ngày 29 tháng 4. Đây là một môi trường phát triển do GitHub thiết kế, cho phép tương tác tự nhiên giữa nhà phát triển và các đại diện Copilot. Nhà phát triển có thể lập kế hoạch, xây dựng, thử nghiệm và thực hiện mã nguồn trong Copilot Workspace, cho phép họ thể hiện sáng tạo của mình một cách nhanh chóng và dễ dàng.
  • App Claude iOS: Công ty khởi nghiệp AI Anthropic đã ra mắt ứng dụng iOS của mô hình Claude vào ngày 1 tháng 5. Ứng dụng này chỉ có kích thước 11MB và cho phép người dùng chat trực tuyến, lưu trữ cuộc trò chuyện trên nhiều thiết bị, và thực hiện phân tích hình ảnh và nhận biết tình huống thực tế.

Kết luận

Sự phát triển của công nghệ trí tuệ nhân tạo đang diễn ra nhanh chóng, với nhiều mô hình và công nghệ mới được giới thiệu mỗi tuần. Sự cải tiến này không chỉ nâng cao hiệu suất của các mô hình hiện tại mà còn mở ra những cơ hội mới trong nhiều lĩnh vực khác nhau. Chúng ta hãy cùng theo dõi và khám phá thêm về những phát triển mới trong lĩnh vực này.

Từ khóa

  • Trí tuệ nhân tạo
  • Mô hình lớn
  • Video Vidu
  • Qwen1.5-110B
  • PEFT


© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...