AI của DeepMind chỉ mất có 4 tiếng tự học đã có thể đánh bại nhà vô địch cờ vua thế giới

Và trong khi AlphaGo Zero cần ba ngày để tự học và trở thành cao thủ cờ vây, AlphaZero chỉ mất có tám tiếng.

Hồi tháng 10, AI của DeepMind đã có một bước tiến quan trọng sau khi AlphaGo đánh bại các kỳ thủ cờ vây hàng đầu thế giới. Cụ thể, phiên bản tiếp theo mang tên AlphaGo Zero đã có thể đánh bại các cao thủ cờ vây chỉ sau ba ngày tự chơi với chính nó và không hề có bất cứ hiểu biết gì về cờ vây trước đó.

Và mới đây, một báo cáo mới nhất cho thấy AI của DeepMind lại tiếp tục có một bước đột phá nữa trong việc tự đào tạo chính nó trong mảng chơi cờ. Cụ thể, phiên bản mới nhất, AlphaZero đã có thể đánh bại AlphaGo chỉ sau 8 tiếng tự học. Vâng, AlphaGo chính là AI đã đánh bại cả cao thủ cờ vây số một thế giới người Trung Quốc cách đây không lâu.

Khi nhảy sang cờ vua, AlphaZero còn “bá đạo” hơn. AI này đã đánh bại Stockfish, nhà vô địch cờ vua thế giới hiện tại, chỉ trong bốn tiếng tự học. Và thậm chí, AlphaZero còn dành 2 tiếng để học shogi, một phiên bản cờ vua của Nhật, và đánh bại những chương trình bot mức độ khó nhất.

Như vậy, có thể nói AI mới của DeepMind đã trở thành cao thủ hàng đầu thế giới trong ba trò chơi có độ phức tạp khác nhau chỉ trong chưa đầy một ngày. Nó hoàn toàn phù hợp với mục tiêu xây dựng phiên bản chung chung của AlphaGo mà nhóm nghiên cứu đề ra.

Theo GenK