阿法狗用的什么算法?
阿尔法围棋(AlphaGo)的主要工作原理是“深度学习”。“深度学习”是指多\x0d\x0a\x0d\x0a层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。\x0d\x0a\x0d\x0a主要包括4个部分:\x0d\x0a1.走棋网络(PolicyNetwork),给定当前局面,预测/采样下一步的走棋。\x0d\x0a2.快速走子(Fastrollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。\x0d\x0a3.估值网络(ValueNetwork),给定当前局面,估计是白胜还是黑胜。\x0d\x0a4.蒙特卡罗树搜索(MonteCarloTreeSearch,MCTS),把以上这三个部分连起来,形成一个完整的系统。\x0d\x0a\x0d\x0a阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
什么是阿尔法狗?
阿尔法狗是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人。其英文名为AlphaGo,音译中文后戏称为阿尔法狗。阿尔法狗其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。扩展资料:2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,在GoRatings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。参考资料来源:人民网——“阿尔法狗”为什么厉害