​星际2 ai表演(DeepMind星际争霸2AI首秀即将上演)

星际2 ai表演(DeepMind星际争霸2AI首秀即将上演)

2016 年 11 月,DeepMind 与著名游戏公司暴雪宣布将在即时战略游戏《星际争霸 2》上合作,这家隶属谷歌的公司将在游戏平台中进行人工智能研究。近两年来,DeepMind 的研究进度时有透露,但距离「人机对战」似乎还有很长一段距离。刚刚,DeepMind 宣布即将公布一个有关星际争霸 2 的「最新进展」,而且会以线上直播的形式展现在世人面前。

星际2 ai表演(DeepMind星际争霸2AI首秀即将上演)(1)

时间:北京时间周五凌晨 2 点

直播链接(Twitch):https://www.twitch.tv/StarCraft直播链接(Youtube):https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A/featured

在 AlphaGo征服围棋之后,《星际争霸》一直被人工智能研究者视为下一个目标,因为它相比国际象棋与围棋更接近「复杂的现实世界」,DeepMind 科学家 Oriol Vinyals 曾表示:「能玩《星际争霸》的人工智能必须能够有效利用记忆,能够进行长期战略规划,同时还得根据不断出现的新情况做出反应调整。以这种标准开发的机器学习系统,最终完全可以应用到现实世界中的任务中去」。

星际2 ai表演(DeepMind星际争霸2AI首秀即将上演)(2)

DeepMind 的星际 2 人工智能看来即将第一次正式亮相了,公司 CEO 丹尼斯·哈萨比斯在社交网络上表示:你不会想错过这次直播的!

在 DeepMind 和暴雪上一次发布星际争霸 2 消息的时候,Oriol Vinyals 在 2018 年暴雪嘉年华上分享了人工智能模型在星际争霸上的惊喜突破。人工智能模型当时已能执行基本的宏观战略,还能防御一些像 Tower Rush 这样的激进战术。

距离上次消息才过去几个月,DeepMind 已经准备好发布更多他们的研究消息。星际争霸系列游戏已经成为人工智能社区的一个巨大挑战,因为在解决像规划、处理不确定性和空间推理等问题时,它们是进行研究最好环境。

1 月 24 号下午 7 点(欧洲中部时间),可以登陆 StarCraft's Twitch channel 和 DeepMind's Youtube channel 来获取更多进展信息。不要错过!

星际争霸 2:最复杂的 RTS 游戏

星际争霸和星际争霸 2 是人类游戏史上最困难、最成功的两款游戏,玩家们在其中彼此竞赛已超过 20 年。最初的游戏也已为人工智能和机器学习研究者所用,他们参加每年一次的 AIIDE 机器人竞赛。星际争霸长盛不衰的部分原因在于其丰富的多层次游戏机制,对于人工智能研究来说,这简直是一个再理想不过的环境。

例如,虽然游戏的目标是击败对手,但玩家也必须顾及并平衡子目标的数量,比如收集资源(水晶和气矿)或建造房屋(提高人口限制)。此外,一场比赛的时间通常为几分钟到一小时不等,这意味着游戏中提早执行的操作也许会很长时间不见成效。最后,由于战争迷雾的存在,地图对于玩家只有部分显示,这意味着智能体必须结合记忆与规划才能成功。

星际争霸还有其他吸引研究者的方面,比如每天在线竞争的大量狂热玩家。这保证了有大量的游戏记录数据可以学习,以及大量可与智能体竞争的优秀人类对手。

甚至星际争霸的操作空间也是一个挑战,可从超过 300 种操作中做选择,相比之下 Atari 游戏只有 10 种操作选择(例如,上下左右等)。在此之上,星际争霸中的操作是层级的,能够进行调整、增强,有很多游戏单位需要点击屏幕控制。即使一个 84x84 的小屏幕,大概也存在 1 亿种可能的操作。

星际2 ai表演(DeepMind星际争霸2AI首秀即将上演)(3)

DeepMind 和暴雪也欢迎更多的科研人员加入挑战这一「最困难游戏」的行列。2017 年,两家公司共同发布了基于星际争霸 2 的人工智能研究环境 SC2LE,它允许研究者在 Linux 系统中接入游戏 API,开展自己的人工智能研究。

人工智能的 APM 被限制了吗?

和 OpenAI 打 Dota 2 时一样,人工智能在玩电脑游戏时因为「反应」更快,所以 DeepMind 在和人类比赛时也需要进行一些限制。

目前最为接近的例子是 Dota 2 人工智能 OpenAI Five,这个人工智能被设定为平均每分钟进行 150-170 次操作(APM=150-170,因为每四帧观察一次,所以理论峰值为 450)。熟练的玩家有可能掌握完美捕捉画面的时机,但这对机器来说轻而易举。OpenAI Five 的平均反应时间为 80 毫秒,这个速度比人类更快。

在 2017 年 DeepMind 提交的论文《StarCraft II: A New Challenge for Reinforcement Learning》中,研究人员曾表示:「人类玩家通常每分钟可以进行 30-300 次操作(即 APM30-300),随着玩家水平的提高,这个数字也会有所提升。职业玩家在极限操作时 APM 有可能超过 500。在 DeepMind 的所有强化学习实验中,人工智能每 8 个游戏帧行动一次,这相当于 APM180。这是一个和中等玩家水平相当的选择。」

星际2 ai表演(DeepMind星际争霸2AI首秀即将上演)(4)

APM180 是「中等水平」……星际争霸真是一个神仙打架的游戏。

人工智能能够打败什么水平的人类玩家?

自 DeepMind 宣布进军星际争霸 2 以来,这家公司一直较为低调,人们一度认为这一非对称信息游戏无法被人工智能在短时间内掌握。在两年多的时间里,DeepMind 也仅仅提交了两篇论文。最近的一篇论文,2018 年 6 月的《Relational Deep Reinforcement Learning》曾提到研究人员正在使用深度强化学习方法解决问题。

论文中写道:DeepMind 的深度强化学习方法可以通过结构化感知和关系推理提高常规方法的效率、泛化能力和可解释性。在 6 个小游戏中的 4 个实现了超越人类大师级玩家水平,DeepMind 是故意没有展现出自己的全部实力吗?

在 2018 年 11 月举行的暴雪嘉年华(Blizzcon)活动中,暴雪曾介绍道:「DeepMind 一直在努力训练人工智能模型,以更好理解星际争霸 2 规则。一旦模型掌握游戏的基本规则,它就可以开始进行一些有趣的行为,比如带农民 Rush 开局。在与「疯狂」难度标准的星际争霸 2 AI 模型对阵的时候,获胜概率可以达到 50%。」

「在人工智能学习人类玩家的游戏录像之后,它就能开始使用常规战术了,同时也可以防御对手诸如 Tower Rush 这样的激进战术。」

除 DeepMind 以外,其他研究机构也在进行自己的努力。去年 9 月份,腾讯 AI Lab 等机构利用深度强化学习开发出了能在《星际争霸 II》全场游戏中打败「疯狂」内置 AI 的智能体(深海暗礁地图,虫族 1 对 1),「疯狂」AI 在视野和采集资源速度上具有不平衡的优势,能力相当于暴雪战网(Battle.net)天梯排名系统中前 30% - 50% 的人类玩家。

星际2 ai表演(DeepMind星际争霸2AI首秀即将上演)(5)

目前星际争霸 2 世界排名前 10 的职业玩家。AlphaGo 的第一次亮相是对阵樊麾二段,OpenAI 的第一次则是在 Dota 2 中单挑战胜了职业玩家 Dendi,如果 DeepMind 的人工智能要对抗人类,会选谁做对手?

目前,OpenAI 的人工智能已能在 Dota 2 上和人类顶尖职业玩家勉强过招了,腾讯 AI Lab 的王者荣耀 AI「觉悟」也在 KPL 决赛上击败了顶尖战队,DeepMind 又会给我们带来哪些惊喜?几十个小时之后答案就会揭晓。

在此,先奶一口DeepMind。

,

​世界十大内燃机火车
​世界十大内燃机火车

世界十大内燃机火车 1.俄罗斯铁路公司的诺瓦切尔卡斯克4E5K机车,17,838马力 2.“铁矿石线”上的庞巴迪IORE,14,483马力 3.由中铁运营、大同电力机车有限公司研发的HXD2机车,13,410马...

​三年级关于学生文明上网公约
​三年级关于学生文明上网公约

三年级关于学生文明上网公约 一、 网络是人生的新朋友,对待朋友要重诺守信。 二、 网络是学习的新源泉,对待源泉要饮水思源。 三、 网络是传播的新载体,对待载体要维护秩序。...

​青藏高原各主要县市海拔表
​青藏高原各主要县市海拔表

青藏高原各主要县市海拔表 黄南藏族自治州马塘镇 德令哈市 (2980 米) 格尔木市 (2850 米) 都兰县 (3180 米) 乌兰县 (2960 米) 天峻县 (3480 米) 大柴旦行政区 (3176 米) 冷湖行...

​女同桌喜欢你的十个表现

女同桌喜欢你的十个表现 从几个表现可以容易看出同桌女喜欢男孩的感觉。 当男孩看向女孩时,她会偷偷地低下头来回避男孩视线,但当男孩目光移开后,她又重新看男孩。就是那种...

​女厕所标志是什么意思
​女厕所标志是什么意思

女厕所标志是什么意思 女厕:上半身的女人头像,或全身的女人身型用中文写明,女厕、女洗手间,有需要的可另加英文、汉语拼音等。 六十、七十、八十年代,很多地方的厕所都是...

​你爱我像谁表达了什么
​你爱我像谁表达了什么

你爱我像谁表达了什么 你爱我像谁,表达了对感情的不确定性,和自己难过和伤心的感觉。 我对你的爱是全身心的付出,不夹杂任何的其他区,但是你呢 你爱我像谁呢 你前面男友的哪...

​莫桑钻gia什么意思
​莫桑钻gia什么意思

莫桑钻gia什么意思 GIA实则是由宝石界的有钱人捐赠的,致力于研究宝石的特性,并对珠宝行业的人员进行相关的培训,GIA作为全球非常权威的鉴定机构,主要服务于珠宝鉴定及专业知识...

​魔兽世界重返卡拉赞单刷路线
​魔兽世界重返卡拉赞单刷路线

魔兽世界重返卡拉赞单刷路线 从前门进先是打午夜, 然后上楼杀掉老2 之后是贞女 再之后是歌剧院 如果不想出本去后门的话过了歌剧会开一个门。 直接过去杀掉5组怪之后能直接到梦...

​美媒评孙颖莎长相
​美媒评孙颖莎长相

美媒评孙颖莎长相 美媒评价孙颖莎圆圆的娃娃脸却非常精致可爱。 在很多球迷看来,孙颖莎是一个不折不扣的新秀,特别是在东京奥运会上,孙颖莎对战日本选手伊藤美诚,可谓是一...

​妈的组词小学一年级
​妈的组词小学一年级

妈的组词小学一年级 奶妈、小妈,姑妈,姨妈、妈妈、星妈、爹妈、祖妈、使妈、翁妈、阿妈、干妈,大姨妈,小姨妈,老妈子,王妈妈,婆婆妈妈 翁妈的解释: ⒈ 方言。对老年妇女...

​v6床垫质量和慕思床垫质量一样吗
​v6床垫质量和慕思床垫质量一样吗

v6床垫质量和慕思床垫质量一样吗 v6床垫质量和慕思床垫质量相比较,慕思床垫质量更好。 慕思床垫是慕思寝室用品有限公司将人体工程学和睡眠环境学融入到寝具的设计中而制造的产...

​niye鼠标为什么用不了
​niye鼠标为什么用不了

niye鼠标为什么用不了 1、开关没开 有些无线鼠标底部有着开关按钮,把这个按钮掰到开的那边,鼠标的灯才能亮,鼠标才会有反应。 2、电池没电 键鼠标使用的是七号电池,有时候鼠标...

​edhardy什么档次
​edhardy什么档次

edhardy什么档次 edhardy高端档次 edhardy是一线品牌,它家的衣服整体来说是相当昂贵的。Ed Hardy中文名叫#34埃德·哈迪#34,衣服的特点是经常使用刺绣、水洗、泼墨的工艺技巧,整体服装给...

​120寸幕布尺寸表
​120寸幕布尺寸表

120寸幕布尺寸表 120寸幕布规格是2.4m×1.8m。 120寸幕布尺寸的比例不同,长和宽也不同。 一般来说,120寸16比9的比例幕布长和宽是266.7cm乘以149cm 120寸4比3比例幕布长和宽是244cm乘以183cm。...

​一斤十六两怎么算
​一斤十六两怎么算

一斤十六两怎么算 一斤十六两是古代的用法,在各个朝代的换算标准也都不同,具体如下: 唐至清代:一两=37.3克,1斤=16两 口诀是: 一两625、2两125、3两1875、4两25、5两3125、6两375、7两...

​小小智慧树嗒嗒噜啦扮演者
​小小智慧树嗒嗒噜啦扮演者

小小智慧树嗒嗒噜啦扮演者 1、小嘟嘟:扮演者赵琼。1998年至2001年就读于湖南省临湘市一中。2005年至今 《智慧树》栏目组咕咚人偶演员。 2、鹏鹏:扮演者未知。托托的年龄为8岁。爱...

​小别胜新婚什么分别多长时间
​小别胜新婚什么分别多长时间

小别胜新婚什么分别多长时间 俗话常说小别胜新婚,是指婚后小小的分别,胜过新婚的甜蜜,我认为,分别不宜过长,一二个月为宜。过长了,容易模糊了感情,冲淡了激情,就是在短...

​香菱学诗的故事概括
​香菱学诗的故事概括

香菱学诗的故事概括 1、首先是拜黛玉为师,并在黛玉指导下细细品味王维诗。 2、其次是一边读杜甫诗,一边尝试作诗。 3、其三是经历了两次失败,终于成功。 香菱作的第一首诗比较...

​乡巴佬是啥意思
​乡巴佬是啥意思

乡巴佬是啥意思 就是没见过世面的乡下农民。乡巴佬是一个贬义词,它是说人没见过什么世面,土里土气,泛着一股乡土气息,有时候也泛指农民。 乡巴佬是啥意思 乡巴佬是城里人对...

​武动乾坤异魔等级
​武动乾坤异魔等级

武动乾坤异魔等级 武动乾坤异魔的等级 异魔兵、统领阶异魔、异魔将、异魔帅、异魔王、异魔皇 异魔皇 异魔族中的皇者,相当于祖境至高强者。 异魔王 分为普通异魔王与真王,普通...