当前位置: 首页 » 行业资讯 » 机器人»AI,無師自通,自學成才?
   

AI,無師自通,自學成才?

 46.1K
     [点击复制]
放大字体  缩小字体 发布日期:2017-10-23   浏览次数:378
核心提示:  人工智能(AI)領域再次出現驚人冲破據英國《天然》雜志近日發表的論文報道,一款新版的阿法狗(AlphaGo)計算機法式能夠從空白狀態起,在不须要任何人類棋譜輸入的條件下,自學圍棋,無師自通,自學成才。  

  人工智能(AI)領域再次出現驚人冲破——據英國《天然》雜志近日發表的論文報道,一款新版的“阿法狗”(AlphaGo)計算機法式能夠從空白狀態起,在不须要任何人類棋譜輸入的條件下,自學圍棋,無師自通,自學成才。

  這款新法式名叫“阿法元”(AlphaGo Zero),其以100比0的不敗戰績,狠狠打擊了曾書寫歷史的舊版“阿法狗”。

AI,無師自通,自學成才?

  實力,“阿法狗”的輝煌戰績

  人工智能“阿法狗”出自谷歌旗下深度思維(DeepMind)公司。最早在2016年1月,《天然》雜志以封面地位報道該法式在和一切其他圍棋法式的對抗中獲得了99.8%的勝率,並且以5︰0的成績打敗了歐洲圍棋冠軍。

  隨后同年3月,“阿法狗”挑戰世界圍棋冠軍李世石,經五局鏖戰,人類1︰4不敵人工智能,引發伟大轟動。人們的震驚源於在圍棋19×19棋盤上,一步乃至會有幾百種走法,傳統的人工智能算法難以估計局势和下子。

  但“阿法狗”仍在積攢實力。本年1月,一個奥秘賬號Master颁布本身恰是“阿法狗”新版。該賬號在著名圍棋平台上前后挑戰柯潔、朴廷桓和井山裕太等頂級高手,豪取勝利,隨后戰贏“棋聖”聶衛平,直至60盤時自爆身份,決勝收官。

  3天,“阿法元”的無師自通

  此次在最新論文中,英國倫敦深度思維公司“阿法狗”項目标重要負責人戴維·西爾弗、戴女士·哈薩比斯及其同事,報告了新版“阿法狗”軟件——“阿法元”。

  “阿法元”最惹人注视之處在於其無師自通的本領。其學習從“零”開始,單純基於與本身的對弈,不须要任何歷史棋譜的指引,也不须要任何人類經驗的點撥。

  對於這個新軟件,人類的輸入僅僅限於一張棋盤和一副棋子,沒有任何人類數據參與。“阿法元”隻用到了一張神經網絡,這張網絡經過訓練,專門預測法式本身的棋步和棋局的贏家,讓“阿法元”在每次自我對弈中進步。

  通過3天的訓練——包含近500萬局自我對弈——“阿法元”已能夠超出人類並打敗之前的“阿法狗”版本。戴維·西爾弗表现,“阿法元”遠比“阿法狗”強年夜,它已不再為人類的知識所限,而能夠自行發現新知識。

  擺脫了人類經驗的輔助和依賴,人工智能居然變得更強!在“阿法元”嶄露頭角后,人們揣測:難道我們人類還耽誤“阿法狗”了?

  震驚,AI的獨立發現

  其實,人工智能的最年夜挑戰之一,等于研發一種能從“零”開始、以超人類的程度學習復雜概念的算法。

  在客岁3月那場世所矚目标比賽中,“阿法狗”軟件打敗了人類圍棋世界冠軍。當時的這款圍棋法式,是应用價值網絡去計算局势,用战略網絡去選擇下子。

  但為了贏得這場人機年夜戰,科學家團隊在訓練“阿法狗”時,同時用到了監督式學習(基於上百萬種人類專業選手的下棋步驟)和基於自我對弈的強化學習。舊“阿法狗”訓練過程長達幾個月,用到多台機器和48個TPU(神經網絡訓練所需的專業芯片)。

  而此次,據研讨團隊介紹,新法式“阿法元”隻应用了一台機器和4個TPU。

  在“阿法狗”之前,最胜利的圍棋法式僅能達到人類業余選手的水平,還不克不及在不讓子的情況下和專業賽手一較高低,本来人們認為,至多要10年先人工智能才有能够達到這一造诣。但“阿法狗”的橫空降生改寫了預言。而在其問世缺乏兩年的時間裡,“阿法元”再次刷新人們的認知——隨著法式訓練的進行,人工智能已獨立發現了人類用幾千年才總結出來的圍棋規則,還树立了新的战略,可以說,人工智能已經為這個陈旧的游戲,帶來全新見解。

只要你关注机器人,你就无法错过睿慕课

 
 
 
[ 行业资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]
 
 
展会更多+
视频更多+
点击排行
 
网站首页 | 网站地图 | 排名推广 | 广告服务 | 积分换礼 | 网站留言 | RSS订阅