Nhóm AI Stanford bị phát hiện đã “mạo danh” mô hình mã nguồn mở thuộc Tsinghua! Sau khi bị phanh phui, toàn bộ dữ liệu bị xóa và bỏ trốn.

Stanford đội ngũ nghiên cứu AI đã gây ra một cuộc tranh cãi lớn khi họ công bố một mô hình đa phương tiện mã nguồn mở mới, được gọi là Llama 3-V. Mô hình này được cho là mạnh hơn GPT-4V, Gemini Ultra và Claude Opus, nhưng kích thước nhỏ hơn 100 lần và chỉ tốn 500 đô la để huấn luyện.

Aksh Garg, thành viên của đội ngũ Stanford, đã giới thiệu về Llama 3-V trên X (trước đây là Twitter). Bài đăng nhanh chóng thu hút sự chú ý với hơn 300 nghìn lượt xem và hơn 300 lượt chia sẻ. Dự án này cũng nhanh chóng lọt vào trang chủ của HuggingFace.

Tuy nhiên, sự phổ biến của dự án này không kéo dài lâu khi người dùng bắt đầu nhận ra những điểm tương đồng đáng ngờ giữa Llama 3-V và mô hình MiniCPM-Llama3-V 2.5 do công ty AI của Thanh Hoá, Công ty Mặt Trời, phát hành.

Người dùng mạng xã hội đã đưa ra bốn bằng chứng chính để chứng minh rằng Llama 3-V có thể chỉ là một phiên bản “đánh cắp” từ MiniCPM-Llama3-V 2.5:

1. **Cấu trúc mô hình và mã gần như giống hệt nhau**: Llama 3-V và MiniCPM-Llama3-V 2.5 dường như sử dụng cùng một cấu trúc mô hình và mã.

2. **Llama 3-V có vẻ chỉ là phiên bản được chỉnh sửa lại của MiniCPM-Llama3-V 2.5**: Mã của Llama 3-V chỉ khác biệt ở việc thay đổi tên biến và định dạng lại một số phần.

3. **Llama 3-V sử dụng cùng một bộ phân loại từ (tokenizer)**: Điều này trở nên đáng ngờ hơn khi nó được công bố trước khi MiniCPM-Llama3-V 2.5 được phát hành.

4. **Nội dung lỗi tương tự**: Khi chạy thử nghiệm trên các hình ảnh của văn bản cổ đại Trung Quốc, cả hai mô hình đều đưa ra kết quả tương tự, thậm chí cả lỗi cũng giống nhau.

Đối mặt với những nghi vấn này, đội ngũ Stanford đã cố gắng giải thích rằng họ chỉ sử dụng tokenizer của MiniCPM-Llama3-V 2.5 và tuyên bố họ đã bắt đầu công việc của mình trước khi MiniCPM-Llama3-V 2.5 được phát hành. Tuy nhiên, giải thích này lại càng làm tăng thêm nghi ngờ của cộng đồng.

Người dùng mạng xã hội tiếp tục tìm hiểu và đưa ra bằng chứng cho thấy Llama 3-V có thể đã sử dụng dữ liệu riêng tư từ Thanh Hoá mà MiniCPM-Llama3-V 2.5 đã được đào tạo. Điều này càng làm tăng thêm nghi ngờ về tính xác thực của dự án.

Cuối cùng, đội ngũ Stanford đã xóa tất cả các bài đăng liên quan đến dự án trên X, Github và HuggingFace. Mặc dù vậy, sự việc vẫn đang tiếp tục gây ra tranh cãi trong cộng đồng nghiên cứu AI.

**Từ khóa:**
– Mô hình đa phương tiện
– Mã nguồn mở
– Tranh cãi
– Stanford
– MiniCPM

công nghệ số

Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.

Những bài viết liên quan:

Trong nửa đầu năm 2024, AI sẽ thực hiện 300 triệu cuộc gọi ra ngoài, ngân hàng Ping An sẽ giảm chi phí và nâng cao hiệu quả nhờ số hóa.

công nghệ số

1năm trước

0860

Không còn phải ghen tỵ với việc tu tiên nữa, tôi đã “làm được” rồi.

công nghệ số

10tháng trước

0700

Các mô hình đầu cuối đang phát động cuộc chiến bứt phá! VC đang điên cuồng cạnh tranh, một công ty khởi nghiệp khác đã “chết” ra mắt.

công nghệ số

10tháng trước

0840

Cạnh tranh trong lĩnh vực văn phòng và lập trình đang trở nên khốc liệt, các ngôi sao mới trong lĩnh vực tạo nhạc Suno và Udio đang vướng vào vụ kiện vi phạm bản quyền | Tin tức lớn trong tuần về mô hình lớn.

công nghệ số

10tháng trước

0690

Chưa có đánh giá nào

Không có đánh giá...

Nhóm AI Stanford bị phát hiện đã “mạo danh” mô hình mã nguồn mở thuộc Tsinghua! Sau khi bị phanh phui, toàn bộ dữ liệu bị xóa và bỏ trốn.

Gemini tự phơi bày việc sử dụng Baidu Wenxin Yiyan để huấn luyện; đội ngũ quản lý của Taotian Group hoàn toàn thay máu; nền tảng X của Musk lại gặp sự cố toàn cầu | Tin tức tuần về AI.

"Long hành" đang đến, "AI Frontline" gửi đến mọi người phúc lợi!

Những bài viết liên quan:

Trong nửa đầu năm 2024, AI sẽ thực hiện 300 triệu cuộc gọi ra ngoài, ngân hàng Ping An sẽ giảm chi phí và nâng cao hiệu quả nhờ số hóa.

Không còn phải ghen tỵ với việc tu tiên nữa, tôi đã “làm được” rồi.

Các mô hình đầu cuối đang phát động cuộc chiến bứt phá! VC đang điên cuồng cạnh tranh, một công ty khởi nghiệp khác đã “chết” ra mắt.

Cạnh tranh trong lĩnh vực văn phòng và lập trình đang trở nên khốc liệt, các ngôi sao mới trong lĩnh vực tạo nhạc Suno và Udio đang vướng vào vụ kiện vi phạm bản quyền | Tin tức lớn trong tuần về mô hình lớn.

Chưa có đánh giá nào

Tin tức mới nhất

Nhóm AI Stanford bị phát hiện đã “mạo danh” mô hình mã nguồn mở thuộc Tsinghua! Sau khi bị phanh phui, toàn bộ dữ liệu bị xóa và bỏ trốn.

Gemini tự phơi bày việc sử dụng Baidu Wenxin Yiyan để huấn luyện; đội ngũ quản lý của Taotian Group hoàn toàn thay máu; nền tảng X của Musk lại gặp sự cố toàn cầu | Tin tức tuần về AI.

"Long hành" đang đến, "AI Frontline" gửi đến mọi người phúc lợi!

Những bài viết liên quan:

Trong nửa đầu năm 2024, AI sẽ thực hiện 300 triệu cuộc gọi ra ngoài, ngân hàng Ping An sẽ giảm chi phí và nâng cao hiệu quả nhờ số hóa.

Không còn phải ghen tỵ với việc tu tiên nữa, tôi đã “làm được” rồi.

Các mô hình đầu cuối đang phát động cuộc chiến bứt phá! VC đang điên cuồng cạnh tranh, một công ty khởi nghiệp khác đã “chết” ra mắt.

Cạnh tranh trong lĩnh vực văn phòng và lập trình đang trở nên khốc liệt, các ngôi sao mới trong lĩnh vực tạo nhạc Suno và Udio đang vướng vào vụ kiện vi phạm bản quyền | Tin tức lớn trong tuần về mô hình lớn.

Chưa có đánh giá nào

Tin tức mới nhất

Nhãn

Nhãn