Không phát hành GPT-5, trực tiếp ra mắt GPT-6? Tin đồn về mô hình mới của OpenAI mang tên Orion, mục tiêu “tiêu diệt” ảo giác.

Hôm qua, tin tức mới nhất cho biết mô hình ngôn ngữ lớn bí ẩn của OpenAI, được gọi là “Strawberry” (Dâu Tây), có thể được ra mắt vào mùa thu năm nay. Dự án này nhằm phát triển một mô hình ngôn ngữ mới có khả năng vượt trội hơn cả GPT-4, với tên mã là Orion, có thể thúc đẩy đáng kể sự phát triển trong lĩnh vực trí tuệ nhân tạo.

Theo hai nguồn tin nội bộ, OpenAI dự kiến sẽ ra mắt phiên bản chatbot của Strawberry như một phần của chức năng ChatGPT. Khả năng suy luận và lý luận được tăng cường của Strawberry sẽ giúp hệ thống AI lên kế hoạch trước và thực hiện nghiên cứu sâu rộng, mở đường cho việc triển khai các hệ thống AI tự chủ phức tạp hơn.

Ngoài ra, Strawberry cũng được kỳ vọng sẽ tạo ra dữ liệu huấn luyện tổng hợp chất lượng cao, hỗ trợ cho dự án Orion. Phương pháp này có thể giảm thiểu lỗi và cải thiện hiệu suất tổng thể của các mô hình thế hệ tiếp theo.

Có thông tin cho rằng Orion sẽ là phiên bản GPT-6 mà OpenAI đang phát triển, bỏ qua luôn phiên bản GPT-5. Một bài đăng trên Twitter từ tài khoản @indigo đã chia sẻ thêm về dự án này.

Toán học đóng vai trò cơ bản trong sự phát triển của AI sinh tạo. Nếu một mô hình AI nắm vững khả năng toán học, nó sẽ có khả năng suy luận mạnh mẽ hơn, giải quyết các vấn đề toán học chưa từng thấy hoặc tự giải quyết vấn đề trở thành, tương đương với trí tuệ con người, điều mà các mô hình ngôn ngữ lớn hiện tại vẫn chưa đạt được.

Mục tiêu của hệ thống Strawberry là tăng cường khả năng suy luận của mô hình OpenAI, giúp xử lý các vấn đề khoa học và toán học phức tạp, cho phép mô hình không chỉ đưa ra câu trả lời mà còn lập kế hoạch trước để tự động duyệt web và thực hiện nghiên cứu sâu rộng theo định nghĩa của OpenAI.

Các nguồn tin cho biết OpenAI đang sử dụng phiên bản lớn hơn của Strawberry để tạo ra dữ liệu huấn luyện cho Orion. Loại dữ liệu được tạo ra bởi AI này được gọi là “dữ liệu tổng hợp”. Kết hợp với dữ liệu tổng hợp chất lượng cao, điều này có thể giảm thiểu lỗi trong Orion và giúp OpenAI nâng cao khả năng thu thập dữ liệu chất lượng cao. Một nghiên cứu đã chỉ ra rằng dữ liệu chất lượng cao là yếu tố then chốt để tạo ra mô hình AI mạnh mẽ và hiệu quả.

CEO của Minion AI, ông Alex Graveley, người từng là kiến trúc sư trưởng của GitHub Copilot, cho biết việc sử dụng Strawberry để tạo ra dữ liệu huấn luyện chất lượng cao có thể giúp giảm số lượng lỗi do mô hình AI tạo ra, hay còn gọi là “ảo tưởng AI”. Ông giải thích: “Hãy tưởng tượng một mô hình không có ảo tưởng, bạn hỏi nó một câu đố logic và nó trả lời đúng ngay lần đầu tiên. Điều này có thể xảy ra vì dữ liệu huấn luyện ít mơ hồ hơn, do đó giảm thiểu phỏng đoán.”

Dự án Strawberry trước đây được gọi là Q*, từ khi bắt đầu lan truyền tin đồn về những bước đột phá lớn của OpenAI từ mùa thu năm ngoái, nó đã trở thành chủ đề bàn tán trong cộng đồng AI. Khi đó, Q* được cho là có khả năng giải quyết các vấn đề khoa học và toán học khó khăn và nhanh chóng được gắn nhãn là dự án AGI bí mật. CEO Sam Altman của OpenAI sau đó đã ngầm xác nhận sự tồn tại của Q*, gọi đó là một “rò rỉ không may”.

Các nguồn tin nội bộ cho biết Strawberry được thiết kế để giải quyết các vấn đề toán học chưa từng thấy và tối ưu hóa các tác vụ lập trình, với khả năng suy luận được tăng cường có thể giúp nó giải quyết hiệu quả hơn các thách thức liên quan đến ngôn ngữ khi có đủ thời gian suy nghĩ.

Trong các bài trình bày nội bộ, Strawberry đã thành công trong việc giải câu đố chữ “Connections” được đăng trên tờ The New York Times. Mô hình này cũng có thể hỗ trợ các hệ thống AI tiên tiến hơn khác, giúp chúng vừa tạo ra nội dung vừa thực hiện hành động. OpenAI cũng đã mô tả kế hoạch sử dụng mô hình Strawberry để thực hiện tìm kiếm internet tự động, nhằm giúp AI có khả năng lên kế hoạch trước và nghiên cứu sâu rộng hơn.

Trước đó, có báo cáo cho biết OpenAI đã thử nghiệm một mô hình AI đạt điểm hơn 90% trong bài kiểm tra chuẩn MATH. Bài kiểm tra MATH bao gồm một loạt các bài toán cấp cao từ cuộc thi toán học dành cho học sinh phổ thông và đại học, được coi là chuẩn mực để đo lường hiệu suất của hệ thống AI trong việc giải quyết các vấn đề toán học phức tạp. So với GPT-4 ban đầu, điểm số khoảng 53%, trong khi GPT-4o đạt 76.6%.

Tin mới nhất cho biết mô hình đạt điểm hơn 90% có thể chính là Strawberry, và OpenAI đã trình diễn mô hình này cho các quan chức an ninh quốc gia Mỹ vào mùa hè này. Do những lo ngại về an ninh, mô hình này không được cung cấp trực tiếp cho công chúng để ngăn chặn việc các quốc gia bị hạn chế bởi Mỹ sử dụng nó để huấn luyện các mô hình AI mạnh mẽ hơn.

OpenAI sẽ cung cấp một phiên bản rút gọn của Strawberry cho công chúng, giúp giảm chi phí triển khai. Phiên bản hoàn chỉnh của Strawberry sẽ được giữ lại cho mục đích tạo ra dữ liệu tổng hợp chất lượng cao. Một số người dùng mạng xã hội nhận xét: “Chất lượng tốt tất nhiên phải giữ lại cho mình dùng trước, đảm bảo có sự khác biệt thế hệ giữa họ và đối thủ cạnh tranh.” Cũng có người đoán rằng OpenAI cần sự hỗ trợ tài chính từ chính phủ Mỹ do không thể huy động đủ vốn từ thị trường.

Ngoài ra, sự ra đời của hệ thống Strawberry có liên kết với nhà khoa học hàng đầu của OpenAI trước đây, Ilya Sutskever, và Đại học Stanford.

Người ta nói rằng dự án này được khởi xướng bởi Ilya, người đã cung cấp ý tưởng và nền tảng cho Strawberry. Trước khi rời khỏi OpenAI, các nhà nghiên cứu Jakub Pachocki và Szymon Sidor đã phát triển Q* dựa trên công việc của Sutskever. Hiện nay, ông đã rời đi và thành lập công ty khởi nghiệp riêng Safe SuperIntelligence, tập trung vào việc phát triển AI siêu thông minh an toàn hơn.

Trong quá trình nghiên cứu Q*, các nhà nghiên cứu của OpenAI đã phát triển một khái niệm được gọi là “tính toán tại thời điểm kiểm tra”, giúp mô hình có thêm thời gian để xem xét toàn bộ yêu cầu hoặc câu hỏi của người dùng, nhằm nâng cao khả năng giải quyết vấn đề của mô hình ngôn ngữ lớn. Khi đó, Ilya cũng đã viết một bài blog về kết quả liên quan.

Có báo cáo cho biết hệ thống Strawberry có nhiều điểm tương đồng với phương pháp “Máy tính Tự học” (STaR) do các nhà nghiên cứu của Đại học Stanford đề xuất, đều nhằm nâng cao khả năng suy luận và giải quyết vấn đề của AI, vượt xa mức mà các mô hình ngôn ngữ hiện tại như GPT-4 có thể đạt được.

Nhìn chung, cả hai phương pháp đều hướng dẫn AI suy luận hoặc suy nghĩ từng bước để tìm ra giải pháp tốt hơn. Phương pháp Quiet-STaR dạy mô hình ngôn ngữ tạo ra và học lý do có thể tiếp tục ở bất kỳ vị trí nào trong văn bản, trong khi Q* nhắm vào việc kết hợp mô hình ngôn ngữ với thuật toán lập kế hoạch. Một yếu tố tương đồng khác là tầm quan trọng của “tính toán tại thời điểm kiểm tra”: trong cả Quiet-STaR và Q*, thời gian suy nghĩ càng dài thì kết quả càng tốt.

Hiện chưa rõ liệu Strawberry có được ra mắt trong năm nay hay không, nhưng phiên bản ban đầu được ra mắt có thể là phiên bản rút gọn, nhấn mạnh việc cung cấp hiệu suất tương tự với tiêu thụ năng lượng thấp hơn. Từ khi mô hình gốc được ra mắt vào tháng 3 năm 2023, OpenAI cũng đã sử dụng công nghệ này để giảm tiêu chuẩn chạy của các biến thể GPT-4.

Theo giả thuyết của OpenAI, tương lai của AI sẽ trải qua 5 giai đoạn: Trợ lý chat (trí tuệ nhân tạo có khả năng giao tiếp bằng ngôn ngữ), Người suy luận (trí tuệ nhân tạo giải quyết vấn đề tương đương con người), Hệ thống hành động (hệ thống có thể thực hiện hành động), Nhà sáng tạo (trí tuệ nhân tạo hỗ trợ phát minh), và Quản lý (trí tuệ nhân tạo có thể quản lý công việc). Strawberry có thể là chìa khóa quan trọng để đạt được giai đoạn thứ hai của AI (người suy luận, giải quyết vấn đề tương đương con người).

Do hạn chế về khả năng suy luận, công nghệ AI hiện tại chưa được ứng dụng rộng rãi trong các ngành công nghiệp đòi hỏi tính toán toán học phức tạp như không gian vũ trụ và kỹ thuật kết cấu. Vì vậy, tối ưu hóa khả năng suy luận toán học của mô hình lớn là điều kiện cần thiết để phổ biến ứng dụng AI và là con đường không thể tránh khỏi để các công ty AI nâng cao lợi nhuận.

Google DeepMind cũng đang nghiên cứu các hệ thống AI có khả năng toán học cao. Họ đã phát triển AlphaProof và AlphaGeometry 2, trong đó AlphaGeometry 2 đã giành huy chương bạc tại Cuộc thi Olympic Toán quốc tế. Tuy nhiên, hiện vẫn chưa rõ hiệu quả và khả năng mở rộng của các mô hình này như thế nào.

### Từ khóa:
– AI
– OpenAI
– Strawberry
– Orion
– Trí tuệ nhân tạo