Alpha Ping Pong đã đến! Sau khi học 14.000 cú đánh, robot bóng bàn của Google đã vượt qua hầu hết các tay chơi! Người dùng mạng: 4 năm nữa sẽ đại diện cho Mỹ tham gia Olympic.

Bóng bàn không chỉ là một môn thể thao, mà còn là một lĩnh vực quan trọng để thử nghiệm trí tuệ nhân tạo (AI). Mùa hè này, tại Olympic Paris 2024, đội tuyển bóng bàn nam và nữ của Trung Quốc đã tiếp tục chứng minh sức mạnh vượt trội của mình, lọt vào trận chung kết.
Đặc biệt, vào ngày 9 tháng 8, nhóm nghiên cứu của DeepMind đã công bố hệ thống AI đầu tiên có khả năng chơi bóng bàn với trình độ nghiệp dư của con người. Hệ thống này kết hợp cánh tay robot công nghiệp ABB IRB 1100 với phần mềm AI tùy chỉnh của DeepMind. Mặc dù các vận động viên chuyên nghiệp vẫn tỏ ra nhỉnh hơn, hệ thống này vẫn cho thấy khả năng ra quyết định nhanh chóng và khả năng thích ứng mạnh mẽ trong việc xử lý các tác vụ vật lý phức tạp.
Trong thập kỷ qua, bóng bàn đã đóng vai trò quan trọng trong việc đánh giá hiệu suất của cánh tay robot, do đòi hỏi tốc độ, phản xạ và chiến lược cao. Nhóm nghiên cứu đã viết trong bài báo tiền xuất bản trên arXiv rằng đây là hệ thống AI đầu tiên có thể chơi bóng bàn ở mức độ tương đương với con người, đánh dấu một cột mốc quan trọng trong lĩnh vực học máy và kiểm soát robot.
Bài báo tiền xuất bản: https://arxiv.org/abs/2408.03906
Mặc dù hệ thống chưa có tên chính thức (chúng tôi đề xuất gọi là “AlphaPong”), nó đã được phát triển bởi David B. D’Ambrosio, Saminda Abeyruwan và Laura Graesser. Trong một nghiên cứu với 29 người tham gia, AI này đã giành chiến thắng 45% số trận đấu. Đặc biệt, nó đạt tỷ lệ thắng 100% khi đối đầu với người mới chơi và 55% khi đối đầu với người chơi trung cấp. Tuy nhiên, nó vẫn chưa sẵn sàng để đối đầu với các vận động viên chuyên nghiệp.
Video Google DeepMind cho thấy cuộc đối đầu giữa AI và các vận động viên bóng bàn thực sự. Một số người dùng mạng xã hội đã bình luận về khả năng của hệ thống AI, với một số người hoài nghi về khả năng của nó, trong khi những người khác lại cho rằng nó có tiềm năng trở thành một vận động viên chuyên nghiệp trong tương lai.
AlphaPong được trang bị cánh tay robot 6 tự do IRB 1100, được lắp đặt trên hai đường ray tuyến tính, cho phép nó di chuyển tự do trên mặt phẳng 2D. Ngoài ra, hệ thống còn sử dụng camera tốc độ cao để theo dõi vị trí của quả bóng và hệ thống theo dõi chuyển động để quan sát cú đánh của đối thủ.
Để điều khiển cánh tay robot, nhóm nghiên cứu đã phát triển một phương pháp hai cấp, cho phép hệ thống thực hiện các chiến thuật cụ thể và điều chỉnh chiến lược theo phong cách của đối thủ. Điều này giúp hệ thống thích ứng với bất kỳ người chơi nghiệp dư nào mà không cần đào tạo riêng biệt.
Cấu trúc của hệ thống bao gồm một bộ điều khiển kỹ năng cơ bản (được đào tạo để thực hiện các kỹ thuật bóng bàn cụ thể như đánh thuận tay, đánh ngược tay hoặc tấn công sau khi nhận bóng) và một bộ điều khiển chiến lược cao cấp (một hệ thống AI phức tạp hơn, có khả năng phân tích tình hình trận đấu, thích ứng với phong cách của đối thủ và chọn chiến lược kỹ năng cơ bản phù hợp với mỗi quả bóng).
Một trong những đổi mới quan trọng của AlphaPong là cách đào tạo mô hình AI cụ thể. Nhóm nghiên cứu đã sử dụng một phương pháp kết hợp, sử dụng học tăng cường trong môi trường vật lý giả lập và sử dụng dữ liệu từ thế giới thực làm nguồn huấn luyện. Điều này cho phép robot học từ khoảng 17.500 đường bay thực tế của quả bóng – một tập dữ liệu khá nhỏ so với nhiệm vụ phức tạp này.
Nhóm nghiên cứu cũng đã sử dụng quá trình lặp lại để hoàn thiện kỹ năng của robot, bắt đầu từ một bộ dữ liệu nhỏ về các trận đấu người máy và sau đó để AI đối đầu với người chơi thực sự. Mỗi trận đấu đều tạo ra dữ liệu mới về đường bay của quả bóng và chiến lược của người chơi, dữ liệu này sau đó được phản hồi vào mô phỏng để tiếp tục đào tạo.
Trong quá trình đào tạo mô phỏng, hệ thống có thể mô phỏng chính xác các đặc điểm vật lý của trận bóng bàn. Khi được triển khai trong thế giới thực, nó sẽ thu thập dữ liệu về hiệu suất của mình so với con người, cải thiện kỹ năng của mình thông qua mô phỏng và tạo ra một vòng phản hồi liên tục.
Quá trình này được lặp lại bảy lần, cho phép robot thích ứng với các đối thủ ngày càng giỏi và phong cách chơi đa dạng hơn. Đến vòng cuối cùng, AI đã học từ hơn 14.000 đường chuyền và 3.000 quả phát bóng, tích lũy kiến thức sâu sắc về bóng bàn, giúp nó thu hẹp khoảng cách giữa mô phỏng và thực tế.
Ngoài ra, NVIDIA cũng đang thử nghiệm hệ thống mô phỏng vật lý tương tự. Ví dụ, hệ thống Eureka cho phép mô hình AI học cách điều khiển cánh tay robot trong không gian mô phỏng nhanh hơn nhiều so với trong thế giới thực, giảm thiểu thời gian và tài nguyên cần thiết cho việc đào tạo.
Ngoài những thành tựu về công nghệ, nghiên cứu này còn khám phá trải nghiệm của con người khi đối đầu với đối thủ AI. Thậm chí khi thua, người chơi vẫn cảm thấy cuộc đấu rất thú vị và hấp dẫn. Nhóm nghiên cứu lưu ý rằng trong tất cả các nhóm kỹ năng và tỷ lệ thắng, người chơi đều cho rằng cuộc đấu với robot “thú vị và cuốn hút”.
Tất nhiên, hệ thống này cũng có những hạn chế. Nó gặp khó khăn trong việc xử lý những quả bóng nhanh và cao, và khó phát hiện các quả bóng xoáy mạnh, đặc biệt là trong cú đánh ngược tay. Video của Google DeepMind cho thấy AI gặp khó khăn trong việc phản ứng với những quả bóng nhanh, khiến nó bị các vận động viên cao cấp đánh bại.
Tuy nhiên, nhóm nghiên cứu của Google DeepMind đang nỗ lực cải thiện những điểm yếu này. Họ đề xuất nghiên cứu các thuật toán điều khiển tiên tiến và tối ưu hóa phần cứng, bao gồm việc khám phá mô hình dự đoán để dự đoán đường bay của quả bóng, hoặc thực hiện giao tiếp nhanh hơn giữa cảm biến và bộ điều khiển của robot.
Nhóm nghiên cứu nhấn mạnh rằng với sự cải thiện tiếp theo, họ tin rằng hệ thống này sẽ có khả năng cạnh tranh với các vận động viên bóng bàn chuyên nghiệp trong tương lai. Với kinh nghiệm trước đó trong việc phát triển các mô hình AI đánh bại con người, như AlphaZero và AlphaGo trong cờ vua và cờ vây, DeepMind đang đặt mục tiêu tiếp theo là bóng bàn.
Ngoài ra, ảnh hưởng của “thần đồng” robot bóng bàn này không chỉ giới hạn trong lĩnh vực bóng bàn. Công nghệ được phát triển cho dự án này có thể áp dụng rộng rãi cho các tác vụ robot yêu cầu phản ứng nhanh và thích ứng với hành vi không thể đoán trước của con người, bao gồm cả sản xuất và chăm sóc sức khỏe.
### Từ khóa
– Trí tuệ nhân tạo
– Bóng bàn
– AlphaPong
– Học máy
– Robot
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...