AI của Google chỉ mất 4 giờ để đánh bại chương trình cờ vua mạnh nhất thế giới

Ban Biên Tập

7 năm trước

Với trình độ tư duy của con người nói chung hiện nay, cờ vua không phải là một trò chơi đơn giản. Nhưng đối với trí thông minh nhân tạo được vận hành bởi một hệ thống tư duy siêu việt (gần giống như tư duy của người ngoài hành tinh) thì trò chơi giải trí thông thường này có thể học chơi một cách thành thạo chỉ sau vài giờ ngắn ngủi.

Trong một báo cáo mới đây, các nhà nghiên cứu của Google đã mô tả chi tiết về cách mà AI (Artificial Intelligence – trí thông minh nhân tạo) được phát triển mới nhất của họ có tên AlphaZero có màn trình diễn phi thường và siêu việt khi chỉ mất 4 giờ để học hết các quy tắc trong môn cờ vua trước khi hạ gục chương trình cờ vua vô địch thế giới – Stockfish.

Nói theo một hướng khác, tất cả các kiến thức cờ vua của con người, thậm chỉ hơn cả thế nữa đã được thu thập và bị vượt qua bởi một AI chỉ trong khoảng thời gian lái xe từ thành phố New York đến Washington DC.

Trí tuệ nhân tạo Alpha Zero đã chiến thắng con người trong chương trình cờ vua vô địch thế giới Stockfish. Ảnh: mGift

Sau khi được lập trình chỉ với các quy tắc chơi của môn cờ vua (không được lập trình các chiến thuật), trong bốn giờ AlphaZero đã chơi thành thạo trong khả năng nó có thể để đánh bại chương trình cờ vua đang được đánh giá cao nhất bây giờ là Stockfish.

Trong loạt 100 ván chơi với Stockfish, AlphaZero đã giành 25 trận thắng khi chơi quân trắng (với lợi thế đi nước đầu tiên) và 3 trận thắng khi chơi quân đen. Hầu hết các ván chơi còn lại có kết quả hòa khi mà cả Stockfish không có chiến thắng nào và AlphaZero cũng không có trận thua nào.

Alpha Zero tỏ ra vượt trội hơn hẳn con người trong quá trình thi đấu cờ vua. Ảnh: VietTimes

Nhà nghiên cứu cờ vua David Kramaley, CEO của website Chessable cho biết: “Giờ chúng ta đã biết ai là chúa tể mới của chúng ta. Chắc chắn nó sẽ cách mạng hóa trò chơi này, nhưng hãy suy nghĩ về việc điều này có thể được áp dụng bên ngoài trò chơi cờ vua. Thuật toán này có thể vận hành được cả các thành phố, lục địa, vũ trụ.”

Được phát triển bởi phòng thí nghiệm AI DeepMind của Google, AlphaZero là một phiên bản đồng dạng của AlphaGo Zero – một chương trình chuyên về chơi trò chơi cờ vây của Trung Quốc.

AlphaZero phát triển dựa trên nền tảng AlphaGo Zero – một chương trình chuyên về chơi trò chơi cờ vây của Trung Quốc. Ảnh: hardwarezone.com.my

DeepMind đã cải tiến AI này trong nhiều năm, trong quá trình đó nó đã khiến vô số các nhà vô địch là con người bại trận trước mạng thần kinh “thần thánh” không thể khuất phục này. Chiến thắng đã lên tới cực điểm vào tháng 10, trong đó một phiên bản hoàn toàn tự sinh mới của AI – chỉ học bằng cách chơi của chính nó mà chưa từng đối mặt với con người nhưng lại đánh bại tất cả các phiên bản trước đó của nó.

Ngược lại, chương trình tiền nhiệm của AlphaGo Zero đã học được một phần cách chơi bằng cách theo dõi những các bước đi được tạo ra bởi những người chơi là con người.

Trí tuệ nhân tạo AlphaGo chiến thắng kỳ thủ cờ vây số 1 thế giới người Trung Quốc. Ảnh: as.nida.ac.th

Đó là nỗ lực nhằm hỗ trợ những AI thiếu kinh nghiệm trong việc học các chiến thuật, nhưng có vẻ như nó thực sự là một điều bất lợi, vì sự tự học hỏi hoàn toàn của AlphaGo Zero đã chứng tỏ hiệu quả hơn rất nhiều trong chế độ chơi một-đấu-một.

Nhà khoa học máy tính Nick Hynes của MIT nói với Gizmodo vào tháng 10 rằng: “Nó giống như một nền văn minh ngoài hành tinh tự phát minh ra thứ toán học của riêng nó. Những gì chúng ta đang thấy ở đây là một mô hình nằm ngoài chiều hướng và giả định của loài người. Nó có thể học bất cứ điều gì nó cho là tối ưu, điều đó thực sự có thể mang nhiều sắc thái khác và quan điểm khác nhau so với những quan niệm của con người chúng ta khi tư duy trong cùng một vấn đề.”

Nhưng mọi thứ đang chuyển động rất nhanh trong lĩnh vực này mà thành công từ tháng 10 đã có thể trở thành lỗi thời. Trong báo cáo mới của mình, nhóm nghiên cứu đã chỉ ra cách mà Alpha Zero đã giành được sự tín nhiệm khi nó tự chơi – được gọi là học hỏi tăng cường – giúp nó có được một sự tập trung lớn hơn vào việc giải quyết vấn đề.

Sự tập trung lớn hơn này có nghĩa là AlphaZero không chỉ chơi cờ vua. Nó cũng chơi cả Shogi (hay còn gọi là cờ Nhật) và cả cờ vây nữa. Có lẽ không có gì đáng ngạc nhiên khi nó chỉ mất hai đến tám giờ để làm chủ những trò chơi đó.

Hiện tại, các nhà khoa học máy tính của Google và DeepMind chưa có bình luận công khai gì về nghiên cứu mới này, chúng cũng chưa được thẩm định bởi các hội đồng chuyên gia.

Câu hỏi đặt ra lúc này là liệu AlphaZero có thể đánh bại con người như các “đàn anh” của mình hay không? Ảnh: How24Kidz

Tuy nhiên, từ những gì chúng ta có thể biết cho đến nay thuật toán đang ngày một phát triển chóng mặt của trí tuệ nhân tạo còn lâu mới kết thúc, thậm chí những cao thủ cờ vua cũng phải bối rối trước chúng.

Ông Peter Heine Nielsen, phát ngôn viên của BBC nói: “Trước đây tôi luôn tự hỏi con người sẽ ra sao nếu có một giống loài cao cấp từ vũ trụ đáp xuống trái đất để chỉ cho chúng ta cách chơi cờ vua nhưng bây giờ thi tôi đã biết rồi. Tôi có thể cảm nhận được sự lo lắng trong mình nếu một ngày các AI này vượt khỏi tầm kiểm soát!.”

Sơn Tùng