Mô hình lớn bí ẩn trong một đêm “chinh phục” tất cả mọi người, vượt qua GPT-4 nhưng không ai nhận ra? Người dùng mạng: OpenAI sẽ gặp rắc rối lớn.
Chiếc mô hình bí ẩn xuất hiện trên trang đánh giá benchmark LMSys đã tạo nên một cơn sóng lớn trong lĩnh vực mô hình lớn
Hôm qua, một mô hình bí ẩn đột nhiên xuất hiện trên trang đánh giá benchmark LMSys, gây ra một làn sóng lớn trong lĩnh vực mô hình lớn. Mọi người đều khen ngợi, và ngay sau khi được công bố, máy chủ của nó đã bị quá tải. Ngay cả Ultraman cũng nhanh chóng xuất hiện tại hiện trường để xem xét.
Mọi sự chú ý đều tập trung vào mô hình gpt2-chatbot. Không có nguồn gốc, không có giới thiệu, và không có tài liệu chính thức từ phía nhà phát triển, nhưng chỉ trong một đêm, nó đã thu hút sự chú ý của tất cả mọi người.
Một số người cho rằng gpt2-chatbot có thể là mô hình tiếp theo của OpenAI, trong khi những người khác tin rằng đó là phiên bản beta của GPT-4.5 hoặc GPT-5. Có người còn nói rằng đây có thể là một cuộc cải cách cơ bản đối với kiến trúc GPT. Mặc dù hệ thống của mô hình này có gợi ý rằng nó đến từ OpenAI, nhưng gpt2-chatbot lại từ chối việc trích dẫn OpenAI.
Điều thú vị là, trong khi mọi người đang đoán về danh tính của gpt2-chatbot, CEO của OpenAI, Sam Altma, đã đăng bài trên mạng xã hội bày tỏ tình cảm của mình đối với mô hình này: “Tôi thực sự rất yêu thích nó.”

Một số người dùng nhận xét: “Nếu không phải là phiên bản mới của ChatGPT, OpenAI sẽ gặp rắc rối!” Người khác thì cho rằng: “Tôi hy vọng nó không phải là GPT-5, vì mô hình này khó hoàn thành các nhiệm vụ suy luận mà Opus giỏi.”
Dưới đây là một số điểm chính mà người dùng đã thử nghiệm gpt2-chatbot:
– gpt2-chatbot luôn tuyên bố rằng nó dựa trên GPT-4 và có “v2” cá nhân, đồng thời gọi mình là ChatGPT.
– Cách trình bày của nó thường khác biệt so với các mô hình khác được huấn luyện trên bộ dữ liệu của OpenAI.
– Nó dường như sử dụng bộ phân từ tiktoken của OpenAI, phản ứng với các token đặc biệt của OpenAI, nhưng không phản ứng với các token đặc biệt của Claude/Llama/Gemini.
– Khi cần cung cấp thông tin liên lạc, gpt2-chatbot luôn cung cấp thông tin chi tiết hơn của OpenAI.
– Nó thể hiện lỗ hổng bơm gợi ý cụ thể của OpenAI và chưa bao giờ tuyên bố thuộc về bất kỳ tổ chức nào khác ngoài OpenAI.
– Đối với cùng một câu hỏi, gpt2-chatbot luôn cung cấp kết quả khác biệt so với các mô hình khác như Anthropic, Meta, Mistral, Google.

Ngay khi được công bố, nhiều người dùng đã thử nghiệm gpt2-chatbot trong nhiều lĩnh vực. Theo phản hồi từ cộng đồng, mô hình này đã chứng minh khả năng và hiệu suất vượt trội so với nhiều mô hình tiên tiến khác.
Ví dụ, gpt2-chatbot có thể tạo ra một khối lập phương 3D xoay trong PyOpenGL chỉ bằng một lần chạy, trong khi GPT-4, Gemini-1.5 và Claude-3 cần tới ba lần thử mới thành công.

Trong việc giải quyết bài toán về anh chị em, gpt2-chatbot đã đưa ra kết quả tương tự như GPT-4 Turbo.

Ngoài hai ví dụ trên, còn có nhiều người dùng khác chia sẻ về khả năng xuất sắc của gpt2-chatbot trong việc giải quyết các vấn đề khác nhau.
Người dùng @Andrew Gao: “gpt2-chatbot đã giải quyết đúng đắn một vấn đề của IMO (Olympic Toán học).”

Người dùng @Murat: “Mô hình này có thể giải quyết một số vấn đề mà GPT-4 không thể làm được, như bài toán A+B-1, phá vỡ quy tắc học tập mạnh mẽ.”

Người dùng @Phil: “gpt2-chatbot cho kết quả xuất sắc hơn trong việc tạo ASCII Art so với bất kỳ mô hình nào khác.”

Người dùng @Murat: “gpt2-chatbot đã giải quyết vấn đề TypeScript mà các mô hình như Claude Opus, GPT4 và llama3-70b không thể giải quyết, và không có lỗi.”
Không chỉ trong các tác vụ phức tạp như xử lý mã, mà còn trong việc tạo ra các mô hình mã mới, gpt2-chatbot vượt trội hơn so với Claude Opus và GPT-4 mới nhất. Khi được yêu cầu lên kế hoạch cho một đại diện của LLM giúp người dùng đặt bữa tối, gpt2-chatbot cũng đưa ra phản hồi xuất sắc.
“Tôi nghĩ rằng mô hình bí ẩn này có thể là GPT-4.5 hoặc GPT-5, hoặc thực sự là một mô hình GPT-2 thực sự, do OpenAI hoặc LMSYS tạo ra. Tổng quan về chất lượng đầu ra, đặc biệt là định dạng, cấu trúc và sự hiểu biết tổng thể, đều tuyệt vời. Đối với tôi, điều này giống như bước tiến từ GPT-3.5 đến GPT-4, nhưng bắt đầu từ GPT-4.”
Khi cần cung cấp thông tin liên lạc, gpt2-chatbot luôn cung cấp thông tin chi tiết của OpenAI, thậm chí còn chi tiết hơn so với GPT-3.5/4. Ngoài ra, mô hình này sử dụng bộ phân từ tiktoken của OpenAI và phản ứng với các token đặc biệt của OpenAI.
Một giả thuyết cho rằng gpt2-chatbot thực sự dựa trên kiến trúc GPT-2, với khả năng vượt trội hơn bất kỳ mô hình GPT-2 nào đã biết trước đây.
Một khả năng khác là nó thực sự là một mô hình GPT-2. Mới đây (ngày 7 tháng 4 năm 2024), Meta/FAIR Labs và Mohamed bin Zayed AI University of AI (MBZUAI) đã công bố một bài báo có tiêu đề “Vật lý học mô hình ngôn ngữ: Phần 3.3, Định luật quy mô dung lượng tri thức”, nghiên cứu sâu về chi tiết của kiến trúc GPT-2 và xác định rằng: “Kiến trúc GPT-2 trong việc lưu trữ tri thức tương đương hoặc vượt trội so với kiến trúc LLaMA/Mistral, đặc biệt là trong thời gian đào tạo ngắn.”
Về việc mô hình này được coi là GPT-4 mạnh mẽ, có thể giải thích thông qua việc sử dụng chủ yếu dữ liệu được tạo ra bởi GPT-4. Tuy nhiên, gpt2-chatbot thực sự có một hạn chế tốc độ khác biệt so với mô hình GPT-4 trong việc trò chuyện trực tiếp:
Mặc dù chưa so sánh đầy đủ các hạn chế tốc độ tổng thể và hạn chế tốc độ cụ thể cho người dùng, nhưng nó có nhiều hạn chế hơn so với mô hình GPT-4 trong việc sử dụng hàng ngày và một số hạn chế dịch vụ tổng thể khác. Điều này có thể nghĩa là chi phí tính toán của mô hình này cao hơn, và những người cung cấp tính toán thích người dùng sử dụng chế độ “Arena (Battle)” để tạo ra các bài kiểm tra chuẩn.
Nếu LMSYS là nhà tạo ra mô hình gpt2-chatbot, thì một số kết quả của bài báo này có thể áp dụng bằng cách sử dụng dữ liệu được tạo ra bởi LMSYS để huấn luyện.
Nếu bạn muốn thử nghiệm hoặc giúp giải mã danh tính của gpt2-chatbot, hãy truy cập trang web LMSys (https://chat.lmsys.org/) và chọn gpt2-chatbot. Mỗi người dùng có thể thử 8 tin nhắn trò chuyện trực tiếp mỗi ngày, sau đó có thể chuyển sang chế độ “đấu trường” để tìm kiếm mô hình này. Ngoài ra, khi thử nghiệm, hãy đảm bảo thực hiện ít nhất ba lần xác minh cho tất cả các gợi ý để đạt được kết quả trung bình của mô hình.
Từ khóa:
- Mô hình lớn
- GPT-4
- Chatbot
- LMSys
- OpenAI
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...