吉奥

首页 » 常识 » 问答 » 豆瓣评分99国内外口碑炸裂的强化学习
TUhjnbcbe - 2021/4/1 16:12:00

脚本之家

你与百万开发者在一起

来源

博文视点

文末赠书

年12月7日,曾研发出在围棋界打败天下无敌手的AlphaGo团队推出了更为强大的AlphaZero,它从零开始训练,仅8小时就击败了与李世石对战的AlphaGov18!然而AlphaZero带来的冲击远不止如此!在AlphaZero的封神之战上,面对当时世上最强的国际象棋引擎Stockfish,AlphaZero没金铩羽以28胜72平的百局不败战绩,将冠*Stockfish斩于马下。这样的结果不免令人震惊,此前大家都认为Stockfish已趋于完美,它的代码中有无数人类精心构造的算法技巧。论速度,Stockfish以每秒6千万个位置的计算能力也足以完爆每秒6万的AlphaZero。可现实情况却是——Stockfish永远不可能战胜AlphaZero。AlphaZero拥有一种更加聪明的思维模式,这使得它更明智,知道该思考什么,该忽略什么。这种更聪明的思维就来源于强化学习。以联结主义的神经网络为代表的深度学习毫无疑问是21世纪初人工智能领域的最重要、最具实用意义的技术突破之一,它为基础研究走向产业应用做出了巨大贡献,也相应地赢得了巨大的声誉和
1
查看完整版本: 豆瓣评分99国内外口碑炸裂的强化学习