Nhóm AI Stanford bị phát hiện đã “mạo danh” mô hình mã nguồn mở thuộc Tsinghua! Sau khi bị phanh phui, toàn bộ dữ liệu bị xóa và bỏ trốn.

công nghệ số5tháng trướccập nhật AIANT
41 00
Nhóm AI Stanford bị phát hiện đã

Stanford đội ngũ nghiên cứu AI đã gây ra một cuộc tranh cãi lớn khi họ công bố một mô hình đa phương tiện mã nguồn mở mới, được gọi là Llama 3-V. Mô hình này được cho là mạnh hơn GPT-4V, Gemini Ultra và Claude Opus, nhưng kích thước nhỏ hơn 100 lần và chỉ tốn 500 đô la để huấn luyện.

Aksh Garg, thành viên của đội ngũ Stanford, đã giới thiệu về Llama 3-V trên X (trước đây là Twitter). Bài đăng nhanh chóng thu hút sự chú ý với hơn 300 nghìn lượt xem và hơn 300 lượt chia sẻ. Dự án này cũng nhanh chóng lọt vào trang chủ của HuggingFace.

Tuy nhiên, sự phổ biến của dự án này không kéo dài lâu khi người dùng bắt đầu nhận ra những điểm tương đồng đáng ngờ giữa Llama 3-V và mô hình MiniCPM-Llama3-V 2.5 do công ty AI của Thanh Hoá, Công ty Mặt Trời, phát hành.

Người dùng mạng xã hội đã đưa ra bốn bằng chứng chính để chứng minh rằng Llama 3-V có thể chỉ là một phiên bản “đánh cắp” từ MiniCPM-Llama3-V 2.5:

1. **Cấu trúc mô hình và mã gần như giống hệt nhau**: Llama 3-V và MiniCPM-Llama3-V 2.5 dường như sử dụng cùng một cấu trúc mô hình và mã.

2. **Llama 3-V có vẻ chỉ là phiên bản được chỉnh sửa lại của MiniCPM-Llama3-V 2.5**: Mã của Llama 3-V chỉ khác biệt ở việc thay đổi tên biến và định dạng lại một số phần.

3. **Llama 3-V sử dụng cùng một bộ phân loại từ (tokenizer)**: Điều này trở nên đáng ngờ hơn khi nó được công bố trước khi MiniCPM-Llama3-V 2.5 được phát hành.

4. **Nội dung lỗi tương tự**: Khi chạy thử nghiệm trên các hình ảnh của văn bản cổ đại Trung Quốc, cả hai mô hình đều đưa ra kết quả tương tự, thậm chí cả lỗi cũng giống nhau.

Đối mặt với những nghi vấn này, đội ngũ Stanford đã cố gắng giải thích rằng họ chỉ sử dụng tokenizer của MiniCPM-Llama3-V 2.5 và tuyên bố họ đã bắt đầu công việc của mình trước khi MiniCPM-Llama3-V 2.5 được phát hành. Tuy nhiên, giải thích này lại càng làm tăng thêm nghi ngờ của cộng đồng.

Người dùng mạng xã hội tiếp tục tìm hiểu và đưa ra bằng chứng cho thấy Llama 3-V có thể đã sử dụng dữ liệu riêng tư từ Thanh Hoá mà MiniCPM-Llama3-V 2.5 đã được đào tạo. Điều này càng làm tăng thêm nghi ngờ về tính xác thực của dự án.

Cuối cùng, đội ngũ Stanford đã xóa tất cả các bài đăng liên quan đến dự án trên X, Github và HuggingFace. Mặc dù vậy, sự việc vẫn đang tiếp tục gây ra tranh cãi trong cộng đồng nghiên cứu AI.

Nhóm AI Stanford bị phát hiện đã

**Từ khóa:**
– Mô hình đa phương tiện
– Mã nguồn mở
– Tranh cãi
– Stanford
– MiniCPM

© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...