冰河。
是一款关于围棋的人工智能程序。
而这款人工智能为了应对围棋的复杂性,结合了监督学习和强化学习的优势。
它通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。
然后,训练出一个价值网络对自我对弈进行预测,以 -1(对手的绝对胜利)到1(冰河的绝对胜利)的标准,预测所有可行落子位置的结果。
这两个网络自身都十分强大,而冰河围棋将这两种网络整合进基于概率的蒙特卡罗树搜索中,实现了它真正的优势。
在获取棋局信息后,冰河围棋会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。
在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为冰河围棋的最终选择。
在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,冰河围棋的搜索算法就能在其计算能力之上加入近似人类的直觉判断。
而冰河人工智能系统,主要由几个部分组成:
一、策略网络(Policy Network),给定当前局面,预测并采样下一步的走棋;
首发域名m.xsbiquge。la
二、快速走子(Fast rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;
三、价值网络(Value Network),给定当前局面,估计是白胜概率大还是黑胜概率大;
四、蒙特卡洛树搜索(Monte Carlo Tree Search),把以上这四个部分连起来,形成一个完整的系统。
第一大脑:落子选择器(move-picker)。
第二大脑:棋局评估器(position-evaluator)。
这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。
这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。
除了这些还有一大段,反正关于人工智能的都写上去了,而且写的特别详细,就好像这个东西是夏铭研究出来的一般。
在场的所有人看到这一份详细的资料后,都呆住了,这么多专业性的词汇和英语单词,他们都有些没看懂,但是幸好有中文翻译,这才让大家大致了解了这个冰河的工作原理。
李达康将这份资料完完整整的看完之后,发出一声惊叹,忍不住的感慨道;
“老杨,你这女婿可找的太对了!真是太优秀了,博学多才啊!”
棋社社长刘东伟看到这资料之后,也忍不住惊叹道:
“小夏的脑子里装的是什么东西啊?他怎么能做出这个资料的?真是太不可思议了!”
杨立国看到他们这幅激动的表情,笑着说道:
“怎么样?我女婿给我的这份资料不错吧?”
刘东伟看完之后,笑着点点头说道;
“这岂止是不错啊,这真是给我来一个天大的助力啊,这小夏分析的太对了,他已经把整个冰河的运作模式告诉我们了。”
此时袁来福也走了过来笑着说道:
“夏铭老师真是太强了,你们看啊,我就说这人工智能不可能会思考吧,这不过是米国佬把它给包装了而已,就是想摧毁我们的心里防线而已,想让我们误以为它真的能够自主思考,其实它的本质还是数据处理,只不过是比传统的ai更加迅速,更加多元化。”
现在他们终于知道这人工智能冰河不为人知的一面了!
既然已经知道了人工智能的工作原理,他们就开始思考接下来的战略了。
(https://www.eexsww.cc/74526/76664834/)
1秒记住E小说网:www.eexsww.cc。手机版阅读网址:m.eexsww.cc