新聞動態(tài)
熱門文章
-
對侵害學(xué)生權(quán)益、危害校園安全的犯罪要堅持“零容忍” 2024-11-19
-
如何幫助一年級孩子盡快適應(yīng)學(xué)校生活? 2024-11-18
-
職業(yè)教育研究要重點關(guān)注15個領(lǐng)域 2024-11-17
阿爾法狗再進化 使用強化學(xué)習(xí)技術(shù)
2017-10-22 | 文章來源:阿爾法狗再進化:100:0碾壓舊版 阿爾法狗再進化,10月19日谷歌旗下人工智能研究部門DeepMind發(fā)布了新版AlphaGo(阿爾法狗)軟件,它可以完全靠自己學(xué)習(xí)圍棋 這款名為AlphaGo Zero的系統(tǒng)可以通過自我對弈進行學(xué)習(xí),它利用了一種名為強化學(xué)習(xí)的技術(shù)。 | 分享到:
阿爾法狗再進化:100:0碾壓舊版 阿爾法狗再進化,10月19日谷歌旗下人工智能研究部門DeepMind發(fā)布了新版AlphaGo(阿爾法狗)軟件,它可以完全靠自己學(xué)習(xí)圍棋 這款名為AlphaGo Zero的系統(tǒng)可以通過自我對弈進行學(xué)習(xí),它利用了一種名為強化學(xué)習(xí)的技術(shù)。
熱點背景
導(dǎo)讀經(jīng)過3天的訓(xùn)練后,這套系統(tǒng)已經(jīng)可以擊敗AlphaGo Lee,也就是去年擊敗韓國頂尖棋手李世石的那套系統(tǒng),而且比分高達100比0。經(jīng)過40天訓(xùn)練后,它總計運行了大約2900萬次自我對弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時候擊敗世界冠軍柯潔的系統(tǒng)),比分為89比11。
【關(guān)注川越微信公眾號,了解更多】