Phiên bản nội địa của Sora đã đến! Mô hình video lớn tiến thêm một bước | Tin tức tuần về mô hình lớn.

Tin tức tuần qua về Trí tuệ nhân tạo

Trí tuệ nhân tạo: Một tuần đầy sự kiện

Phiên bản nội địa của Sora đã đến! Mô hình video lớn tiến thêm một bước | Tin tức tuần về mô hình lớn.

Ngành công nghiệp trong tuần này đã chứng kiến sự phát triển mạnh mẽ về công nghệ, tối ưu hóa mô hình, ứng dụng liên ngành và nghiên cứu khoa học. Mô hình Video Vidu, mô hình dự đoán đa token và gpt2-chatbot đều thể hiện hiệu suất đột phá. Công ty Yuanxiang đã mở nguồn mô hình đa mô thức XVERSE-V, Alibaba Cloud đã công bố mô hình Qwen1.5-110B với 110 tỷ tham số, thúc đẩy chia sẻ và tiến bộ của công nghệ AI.

Công nghệ PEFT và cấu trúc mạng thần kinh KAN đã được đề xuất, mang lại hướng mới cho việc huấn luyện và thiết kế cấu trúc mô hình lớn. Anthropic đã ra mắt ứng dụng iOS của mô hình Claude, và GitHub đã giới thiệu Copilot Workspace, tăng cường khả năng sử dụng AI trên nền tảng di động và môi trường phát triển.

Một số điểm nổi bật:

Vidu: Được công bố vào ngày 27 tháng 4 bởi Shengshuju và Đại học Thanh Hoa, Vidu là mô hình video đầu tiên ở Trung Quốc có khả năng dài hạn, nhất quán và động lực cao. Vidu có thể mô phỏng hiện tượng vật lý thực tế và hỗ trợ nhiều ống kính, đồng thời đạt được độ nhất quán không gian-thời gian cao. Nó sử dụng cấu trúc U-ViT độc đáo kết hợp giữa Diffusion và Transformer, cho phép tạo ra nội dung video chất lượng cao với độ phân giải 1080P trong 16 giây.
gpt2-chatbot: Vào ngày 30 tháng 4, một mô hình chatbot tên gpt2-chatbot đã thu hút sự chú ý trên mạng xã hội. Nhiều người dùng đã kiểm tra và nhận thấy khả năng của nó không kém so với GPT-4, thậm chí còn vượt trội hơn trong một số tác vụ.
Mô hình dự đoán đa token: Đội ngũ Meta AI Pháp đã giới thiệu mô hình dự đoán đa token vào ngày 30 tháng 4, đặc biệt hiệu quả trong các tác vụ lập trình. Với mô hình 13 tỷ tham số, nó đã giải quyết 12% vấn đề bổ sung trên chuẩn benchmark HumanEval và 17% vấn đề bổ sung trên chuẩn benchmark MBPP. Ngoài ra, mô hình này cũng cho thấy thành tựu đáng kể trong việc suy luận thuật toán nhỏ và tổng quát hóa ngoài phân phối.
XVERSE-V: Công ty Yuanxiang đã công bố và mở nguồn mô hình đa mô thức XVERSE-V vào ngày 28 tháng 4, cho phép sử dụng không điều kiện và thương mại miễn phí.
Qwen1.5-110B: Vào ngày 29 tháng 4, Alibaba Cloud đã công bố mô hình Qwen1.5-110B với 110 tỷ tham số, đạt thành tích tốt nhất hiện tại trong nhiều bài kiểm tra chuẩn. Mô hình này kế thừa kiến trúc giải mã Transformer từ Qwen1.5 và giới thiệu phương pháp chú ý nhóm truy vấn, giúp mô hình hoạt động hiệu quả hơn trong quá trình suy luận. Qwen1.5-110B hỗ trợ ngữ cảnh lên đến 32K và xử lý tốt nhiều ngôn ngữ khác nhau.
Awaker 1.0: Công ty Zizijiqi đã công bố mô hình đa mô thức Awaker 1.0 vào ngày 27 tháng 4, sử dụng kiến trúc MOE sáng tạo và có khả năng cập nhật tự động. Trong việc tạo video, Awaker 1.0 sử dụng nền tảng tạo video VDT do công ty tự phát triển, vượt qua Sora trong việc tạo video chân thực.
PEFT: Nhóm nghiên cứu từ Đại học Northeastern, Đại học California Riverside, Đại học Arizona State và Đại học New York đã khám phá ứng dụng và hướng phát triển của công nghệ PEFT trong việc huấn luyện mô hình lớn vào ngày 29 tháng 4. Công nghệ này cung cấp một cách hiệu quả để thích ứng mô hình tiền huấn luyện cho các tác vụ cụ thể.
KAN: Nhóm nghiên cứu từ MIT, Caltech, và Đại học Northeastern đã công bố cấu trúc mạng thần kinh KAN vào ngày 30 tháng 4, một cấu trúc hoàn toàn mới so với MLP truyền thống. KAN cho phép đạt được độ chính xác cao hơn với ít tham số hơn trong việc giải quyết các vấn đề toán học và vật lý. Nó cũng tránh được vấn đề quên triệt tiêu trong quá trình xử lý mô hình lớn và dễ dàng tích hợp kiến thức chuyên ngành.
Copilot Workspace: GitHub đã ra mắt phiên bản kỹ thuật xem trước của Copilot Workspace vào ngày 29 tháng 4. Đây là một môi trường phát triển do GitHub thiết kế, cho phép tương tác tự nhiên giữa nhà phát triển và các đại diện Copilot. Nhà phát triển có thể lập kế hoạch, xây dựng, thử nghiệm và thực hiện mã nguồn trong Copilot Workspace, cho phép họ thể hiện sáng tạo của mình một cách nhanh chóng và dễ dàng.
App Claude iOS: Công ty khởi nghiệp AI Anthropic đã ra mắt ứng dụng iOS của mô hình Claude vào ngày 1 tháng 5. Ứng dụng này chỉ có kích thước 11MB và cho phép người dùng chat trực tuyến, lưu trữ cuộc trò chuyện trên nhiều thiết bị, và thực hiện phân tích hình ảnh và nhận biết tình huống thực tế.

Kết luận

Sự phát triển của công nghệ trí tuệ nhân tạo đang diễn ra nhanh chóng, với nhiều mô hình và công nghệ mới được giới thiệu mỗi tuần. Sự cải tiến này không chỉ nâng cao hiệu suất của các mô hình hiện tại mà còn mở ra những cơ hội mới trong nhiều lĩnh vực khác nhau. Chúng ta hãy cùng theo dõi và khám phá thêm về những phát triển mới trong lĩnh vực này.

Từ khóa

Trí tuệ nhân tạo
Mô hình lớn
Video Vidu
Qwen1.5-110B
PEFT

công nghệ số

Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.

Những bài viết liên quan:

Ưu đãi cho fan hâm mộ | Ngày 23 tháng 11, tham gia một buổi tiệc vừa chơi vừa kiếm tiền!

công nghệ số

10tháng trước

0720

Đảm bảo không có việc làm, “tra tấn tinh thần” suốt ngày! 80% người đóng góp cho sản phẩm tương tự ChatGPT có mức lương giờ chỉ 1.16 USD, nhưng cũng không có lựa chọn nào khác.

công nghệ số

10tháng trước

0780

Hiểu video theo thời gian thực lần đầu tiên được triển khai! Wallbreaker Mini 2.6 mang đến khả năng hiểu hình ảnh đơn, hình ảnh đa và video SOTA, hoàn toàn đối đầu với GPT-4V đa mô hình mạnh nhất.

công nghệ số

10tháng trước

0790

Microsoft thống trị lập trình AI? GitHub bị cáo buộc bí mật phát triển API riêng cho Copilot, “giết chết” Cursor và nhiều sự thay thế mã nguồn mở khác!

công nghệ số

1năm trước

0850

Chưa có đánh giá nào

Không có đánh giá...

Phiên bản nội địa của Sora đã đến! Mô hình video lớn tiến thêm một bước | Tin tức tuần về mô hình lớn.

Trí tuệ nhân tạo: Một tuần đầy sự kiện

Một số điểm nổi bật:

Kết luận

Từ khóa

Làm thế nào để đạt được tốc độ 1,5 lần cho vLLM thông qua sự thưa thớt KV?

AI phát triển mạnh mẽ, đội ngũ kỹ thuật của bạn có khả năng nắm bắt xu hướng không? | Thời gian Geek.

Những bài viết liên quan:

Ưu đãi cho fan hâm mộ | Ngày 23 tháng 11, tham gia một buổi tiệc vừa chơi vừa kiếm tiền!

Đảm bảo không có việc làm, “tra tấn tinh thần” suốt ngày! 80% người đóng góp cho sản phẩm tương tự ChatGPT có mức lương giờ chỉ 1.16 USD, nhưng cũng không có lựa chọn nào khác.

Hiểu video theo thời gian thực lần đầu tiên được triển khai! Wallbreaker Mini 2.6 mang đến khả năng hiểu hình ảnh đơn, hình ảnh đa và video SOTA, hoàn toàn đối đầu với GPT-4V đa mô hình mạnh nhất.

Microsoft thống trị lập trình AI? GitHub bị cáo buộc bí mật phát triển API riêng cho Copilot, “giết chết” Cursor và nhiều sự thay thế mã nguồn mở khác!

Chưa có đánh giá nào

Tin tức mới nhất

Phiên bản nội địa của Sora đã đến! Mô hình video lớn tiến thêm một bước | Tin tức tuần về mô hình lớn.

Trí tuệ nhân tạo: Một tuần đầy sự kiện

Một số điểm nổi bật:

Kết luận

Từ khóa

Làm thế nào để đạt được tốc độ 1,5 lần cho vLLM thông qua sự thưa thớt KV?

AI phát triển mạnh mẽ, đội ngũ kỹ thuật của bạn có khả năng nắm bắt xu hướng không? | Thời gian Geek.

Những bài viết liên quan:

Ưu đãi cho fan hâm mộ | Ngày 23 tháng 11, tham gia một buổi tiệc vừa chơi vừa kiếm tiền!

Đảm bảo không có việc làm, “tra tấn tinh thần” suốt ngày! 80% người đóng góp cho sản phẩm tương tự ChatGPT có mức lương giờ chỉ 1.16 USD, nhưng cũng không có lựa chọn nào khác.

Hiểu video theo thời gian thực lần đầu tiên được triển khai! Wallbreaker Mini 2.6 mang đến khả năng hiểu hình ảnh đơn, hình ảnh đa và video SOTA, hoàn toàn đối đầu với GPT-4V đa mô hình mạnh nhất.

Microsoft thống trị lập trình AI? GitHub bị cáo buộc bí mật phát triển API riêng cho Copilot, “giết chết” Cursor và nhiều sự thay thế mã nguồn mở khác!

Chưa có đánh giá nào

Tin tức mới nhất

Nhãn

Nhãn