亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

AlphaGo與AlphaZero原理和未來應(yīng)用研究

摘要:人工智能長期以來的目標就是創(chuàng)造機器的完全主導(dǎo)領(lǐng)域,在人類生活中發(fā)揮作用。AlphaGo成為首個在圍棋中戰(zhàn)勝人類世界冠軍的系統(tǒng)。AlphaGo神經(jīng)網(wǎng)絡(luò)使用人類的棋盤數(shù)據(jù)進行學(xué)習(xí)訓(xùn)練,同時也通過自我對弈進行強化學(xué)習(xí)。圍棋對于人工智能來說是最具有挑戰(zhàn)性的經(jīng)典博弈比賽,它的巨大的搜索空間,棋局和落子地點讓機器學(xué)習(xí)難以應(yīng)對??茖W(xué)家創(chuàng)造了一種新的人工智能程序系統(tǒng)AlphaGo,使用估值網(wǎng)絡(luò)來評估局勢以及使用策略網(wǎng)絡(luò)來選擇如何落子。這些深度神經(jīng)網(wǎng)絡(luò)被一種新的組合來訓(xùn)練:使用了人類專業(yè)比賽數(shù)據(jù)的監(jiān)督學(xué)習(xí),以及自我對弈的強化學(xué)習(xí)。AlphaZero沒有使用任何預(yù)測搜索的方法,神經(jīng)網(wǎng)絡(luò)搭配最先進的蒙特卡洛樹搜索算法讓程序達到了更加精確和智能的水準,這程序模擬了數(shù)以千計的自我對弈的隨機博弈。Alpha系列達到了99.8%的勝率,這是史上第一次計算機程序在全尺寸圍棋中擊敗人類職業(yè)棋手。通過對AlphaGo和AlphaZero原理學(xué)習(xí),我們可以在掌握現(xiàn)有先進技術(shù)的基礎(chǔ)上,開拓創(chuàng)新,思考類似的人工智能在醫(yī)學(xué),軍事等領(lǐng)域的未來應(yīng)用可能性。

關(guān)鍵詞:
  • alphago  
  • alphazero  
  • 策略網(wǎng)絡(luò)與決策網(wǎng)絡(luò)  
  • 蒙特卡洛樹搜索  
作者:
陳銘禹
單位:
杭州師范大學(xué)附屬中學(xué); 浙江杭州310030
刊名:
通訊世界

注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

期刊名稱:通訊世界

通訊世界雜志緊跟學(xué)術(shù)前沿,緊貼讀者,國內(nèi)刊號為:11-3850/TN。堅持指導(dǎo)性與實用性相結(jié)合的原則,創(chuàng)辦于1994年,雜志在全國同類期刊中發(fā)行數(shù)量名列前茅。