阿尔法狗围棋战赢得人类选手 却在计时上略有bug
作者:本站整理 时间:2016-06-29
大家知道人工智能阿尔法狗在围棋赛中赢了人类选手,之后便沸沸扬扬掀起了关于人工智能的热潮,谷歌的人工智能围棋系统也成为了全球学习的重要案例,但是追其根本,阿尔法狗的成功还是要归结于人工程序员。
AlphaGo是DeepMind的两大神经网络之一。其技术包括监督学习(即研究人类棋手的棋谱),以及增强学习(自己与自己练习,并从中改进)。不过最新消息显示,有些东西AlphaGo无法通过学习去掌握。
DeepMind研究总监索尔·格雷佩尔(Thore Graepel)表示,最终完成的AlphaGo系统非常善于发现,应当专注于棋盘的哪个区域。不过,AlphaGo并不擅长何时停止思考,完成落子。
这带来了问题,因为顶级围棋赛事有着复杂的计时系统。例如,在与李世石的对局中,双方各有2小时的常规时间去落子,并在时间耗尽后有3次读秒机会。棋手可以选择在某一回合中启动读秒。但如果全部读秒时间耗尽,那么就会被判负。
格雷佩尔表示:“人类能进行复杂的时间管理。在困难的局面下,他们会思考更长时间,而在简单的局面下,他们花的时间较少。我们试图让AlphaGo也能做到这点。”
“时间是重要资源:我们思考某一步棋的时间越长,那么下法就可能越好。然而,时间是有限的。因此我们提出了一些方法,即如果算法在更长时间的思考后不会改变决策,那么我们可以探测出这点。”
研究团队并未在AlphaGo的围棋知识中加入时间规则,而是引入了额外的限制。与核心引擎不同,时间算法是由人工设计的。
不过,这仍完全基于算法。格雷佩尔表示:“通过评价系统,我们进行了优化。我们会比较不同的耗时曲线,例如在开始阶段用时较少,随后用时增多,或是开始用时较多,随后逐渐减少。我们测试了哪种方法效果最好。”
因此,目前还不必担心机器抢走人类的工作,人类仍有工作要做,例如控制秒表。
相关文章
相关推荐
-
酷盘 3.2.7(文件管理备份工具)
-
易信掌中云电脑版 v4.7.6
-
智慧列车信息查询软件官方安装版 V2.0.1
-
Video Rotator V1.0.7官方版(视频处理)
-
TeamViewer简体中文版 v12.0.71503
-
XMIND2020官方版 V10.2.1
-
BOBO娱乐正式版 v2.2.2.1
-
Wise Care 365官方安装版 V5.5.9
-
鼎易数影仪x500驱动 官方版
-
通讯财神手机销售管理软件 2015(手机销售管理专家)
-
路然电台官方版 v1.0
-
首码资产管理系统官方版 v1002.1
-
雨滴桌面主题秀 rainmeter3.2(桌面美化工具)中文版
-
pq分区魔术师中文版 v10.0
-
CCleaner pro中文版 v5.25.5902
-
百度互通游 V2.2.8.107官方版(安卓模拟器)