AlphaGo之后AlphaStar又来了!继围棋后,星际2职业高手也被AI击溃
来源:综合凤凰科技、华尔街见闻、中关村在线等报道
继AlphaGo在围棋界战无不胜之后,人工智能又向游戏与电竞行业进军了。
北京时间1月25日凌晨2点,暴雪与谷歌DeepMind团队合作研究的星际争霸人工智能“AlphaStar”正式通过直播亮相。
按照直播安排,AlphaStar与两位《星际争霸2》人类职业选手进行了5场比赛对决演示。加上并未在直播中演示的对决,在人类vs AlphaStar人工智能的共计11场比赛中,人类只取得了一场胜利。
AlphaStar在这些比赛中展现出来的优点是,能够立刻看到整个地图,不过DeepMind也和人类玩家进行了合作,在对战地图上进行平衡。主要的问题在于,AlphaStar还不能比人类更快做出反应,每分钟里也不能执行更多的动作。在之后的演示比赛中,人类选手有更多时间分析ai,最终击败AlphaStar。
赛后,DeepMind研究联席负责人David Silver表示:
尽管后续还有很多工作要做,但我希望未来的人们在回顾今日时,可以将这一比赛结果视为ai能力又向前迈了一步的表现。
DeepMind官网资料显示,作为最具挑战性的即时战略(RTS)游戏之一,也是电竞历史最为悠久的游戏之一,暴雪出品的《星际争霸2》近年来已被公认为ai研究的“大挑战(grand challenge)”。
对于ai而言,这类游戏比国际象棋、围棋等棋盘类游戏来得更难,不仅因为没有最佳策略,也是因为人工智能无法通过观察前一块棋子的移动来计算下一步棋,而必须实时作出反应。
时至今日,ai仍在挣扎应对《星际争霸2》的复杂性,鲜有系统能与职业选手的技术相媲美。
不过,AlphaStar与普通ai不太一样,它所使用的深度神经网络是通过监督学习(supervised learning)和强化学习(reinforcement learning)直接从原始游戏数据当中训练出来的。也就是说,它成长的每一步都是一场完整的比赛。
AlphaStar所遇到的第一个对手是《星际争霸2》Liquid战队的虫族选手TLO。在比赛前,DeepMind对ai进行了为期一周的训练,相当于让它玩了200年的《星际争霸2》。
尽管TLO曾自信表示有能力打败人工智能,但AlphaStar仍旧赢得了全部五场比赛,每一次还都使用了完全不同的独特策略。
但值得注意的是,在这场对抗中,AlphaStar确实更有优势——首先是因为比赛使用神族,而非TLO最擅长的虫族;二是因为尽管ai选手的视野也受到战争迷雾的限制,但它看到的地图已经被缩小了。
这也就意味着它无需像人类选手一样分配时间去关注地图的不同部分,而可以直接处理敌军和自家基地的信息。
AlphaStar对战星际职业选手TLO
此后,AlphaStar在与TLO的同队战友MaNa进行比赛时,已不再是当初稚拙的“菜鸟”,没有再犯前一次比赛中的明显战术错误。在脱胎换骨的ai面前,使用擅长种族神族的MaNa最终也是铩羽而归。
眼看着ai接连战胜两位人类高阶选手,DeepMind又开始对AlphaStar进行了全新的训练——削去它纵览全图的能力,要求它像人类玩家一样必须不断切换地图视野。
又是一周的训练过去,AlphaStar的游戏水平迅速提升。不过,视野受限显然限制了ai选手采取此前惊人策略的能力,并最终在MaNa的猛烈攻势下举起白旗。
但从DeepMind给出的图表可以看出,第二版AlphaStar在受训七天后的水平已经很接近原始版本。
目前,全部11场比赛的录像均已在DeepMind官网上释出,供观众下载。针对部分观众的质疑,TLO也给出了回应:
我想对那些说MaNa没打好比赛的人说,相信我,与AlphaStar这样的对手打比赛真的很难,因为它的打法与人类完全不同,我们之前也完全没有经验。AlphaStar给人留下了极其深刻的印象。在我看来,它还是前所未有的游戏ai。