本文來源于微信號(hào):找借口安靜
原文地址:https://www.nli-research.co.jp/report/detail/id=55940?site=nli
原文題目:AIは囲碁や將棋の必勝法等にどのような影響を與えていくのか
作者:中村亮一
借助電腦找到棋類必勝法水果機(jī)必贏壓法的可能性
(續(xù)上)隨著電腦軟件的日益發(fā)展,如果能找到這個(gè)棋類游戲的必勝法,那肯定會(huì)非常有意思。
但是,根據(jù)目前的電腦性能來看,圍棋和將棋等棋類需要對(duì)所有變化進(jìn)行分析才可以得出結(jié)論,必然對(duì)電腦產(chǎn)生巨大的負(fù)擔(dān)。雖然今后隨著有更好的IT技術(shù)被投入使用,這樣的找到必勝法或者先后手的優(yōu)勢(shì)才得以成為可能。但現(xiàn)階段實(shí)現(xiàn)這個(gè)目標(biāo)還是非常困難的。
根據(jù)計(jì)算機(jī)研究學(xué)者,公立函館未來大學(xué)教授松原仁得出的數(shù)據(jù)。64格國際象棋和6*6的奧賽羅棋的變化數(shù)有10的30次方。8*8的奧賽羅棋的變化有10的60次方。國際象棋有10的120次方,將棋是10的220次方,而圍棋達(dá)到水果機(jī)必贏壓法了10的360次方。
順便提一下,太陽的壽命大概在100億年左右,也就是說大概有3.2×10的17次方秒。也就是說,這些棋類的變化數(shù)遠(yuǎn)比這個(gè)數(shù)字大。
借助電腦找到棋類必勝法的進(jìn)展
對(duì)此,首先我們要用一臺(tái)高性能的電腦程序進(jìn)行左右互搏,可以初步了解這些棋類先手的有利程度。這一點(diǎn)是我們目前所要完成的目標(biāo),也是當(dāng)下可以實(shí)現(xiàn)的目標(biāo)。
比如我們通過AlphaGo的左右互搏,來思考現(xiàn)在頂尖棋手之間的貼目規(guī)則是否合適,今后隨著圍棋技術(shù)的改進(jìn),先手的有利程度將會(huì)有怎么樣的變化。這些問題如果可以解決,可以說棋類就將會(huì)變得更加有意思。
但是,谷歌宣布AlphaGo所用的技術(shù),今后將應(yīng)用到醫(yī)療以及能源領(lǐng)域,所以這一次人機(jī)大戰(zhàn)的勝利也是AlphaGo和人類棋手之間的絕唱。
AlphaGo使用了“深度學(xué)習(xí)(Deep Learning)”技術(shù),仿照了人類多層構(gòu)造的神經(jīng)網(wǎng)絡(luò),進(jìn)行自我的機(jī)械化學(xué)習(xí)。然后采取了“強(qiáng)化學(xué)習(xí)(Reinforcement Learning)”,也就是自己給自己進(jìn)行反復(fù)的對(duì)局,由AlphaGo自己來找到贏棋的方法,完成這一個(gè)程序。
由此可見,我們可以期待今后的電腦程序,將會(huì)以全新的制造方法進(jìn)行開發(fā)。因此,之前我們根據(jù)戰(zhàn)術(shù)而收獲的戰(zhàn)果,在電腦面前會(huì)呈現(xiàn)給我們完全不一樣的結(jié)果。再者,DeepMind團(tuán)隊(duì)在和柯潔的三番棋結(jié)束之后,公開了AlphaGo的50局左右互搏的棋譜,從棋譜的內(nèi)容來看,可以看出AlphaGo接連下出了我們?nèi)祟惼迨指鞠氩坏降钠濉?/p>
我相信今后還會(huì)進(jìn)行一定規(guī)模的電腦軟件之間的對(duì)局。即便如此,電腦程序現(xiàn)在已經(jīng)達(dá)到了超過人類的水平,但是要解決我們非常關(guān)心的問題,這需要更多的資源才得以讓實(shí)驗(yàn)繼續(xù)下去。雖然這個(gè)實(shí)驗(yàn),把人工智能應(yīng)用到社會(huì)上的可能性并不大,但是對(duì)此還是比較遺憾的。
結(jié)語
其實(shí)我們沒有必要把太多的關(guān)注度轉(zhuǎn)移到找到棋類的必勝法,以及先后手的有利程度上?,F(xiàn)在的規(guī)則也是根據(jù)之前人和人對(duì)局得到的數(shù)據(jù),通過一定的判斷而設(shè)定的規(guī)則。假如今后計(jì)算能力比人類厲害的電腦軟件,通過自我對(duì)局來推導(dǎo)出什么樣的結(jié)果,可能會(huì)出現(xiàn)其他跟以往不同的結(jié)果。因此,電腦程序得到的結(jié)果可能最多只是一個(gè)參考作用。
另外,隨著電腦程序越來越強(qiáng),人類也會(huì)學(xué)習(xí)電腦的招法提高自己的技術(shù)。今后雙方互相切磋琢磨,會(huì)演變成異次元的比賽,可以期待游戲?qū)?huì)變得越來越有意思。
同時(shí),不會(huì)因?yàn)殡娔X的出現(xiàn),也不會(huì)因?yàn)殡娔X破解了這個(gè)游戲,把游戲的樂趣給打消甚至消滅這項(xiàng)游戲?,F(xiàn)在五子棋依舊被廣泛熟知并樂在其中,由五子棋演變的連珠現(xiàn)在成為了一個(gè)競(jìng)技類游戲而被廣泛普及。
最終享受游戲的樂趣是我們?nèi)祟?,制造游戲?guī)則的還是我們?nèi)祟?。必要情況下我們會(huì)對(duì)規(guī)則進(jìn)行改動(dòng),這在體育界頻繁地在進(jìn)行著。游戲最終也會(huì)根據(jù)情況,制定一個(gè)合適的規(guī)則是不可缺少的。
假如游戲所有的分析都由電腦來完成的話,即便規(guī)則上有一個(gè)小小的改動(dòng),都會(huì)對(duì)電腦分析產(chǎn)生巨大的影響。那樣的話電腦之前做的分析的意義將會(huì)被降低。電腦能否根據(jù)規(guī)則的改變而做出適合的應(yīng)對(duì)是無法預(yù)測(cè)的。
人類始終都是游戲的操作者,人類可以隨意的更改規(guī)則,而人類也具備更改規(guī)則之后的應(yīng)對(duì)。
人工智能無論變得多強(qiáng),即便最終把游戲破解出來,人類依舊可以在界定的規(guī)則里,下出自己想到的最佳的一手棋,繼續(xù)體會(huì)游戲的深?yuàn)W和魅力,享受游戲帶給我們的樂趣。(完)
弈客圍棋原創(chuàng)整理
更多精彩賽事直播,棋文弈事,盡在弈客圍棋,下載弈客APP,和熱愛圍棋的棋友對(duì)弈手談水果機(jī)必贏壓法!
https://www.yikeweiqi.com/
評(píng)論列表
還沒有評(píng)論,快來說點(diǎn)什么吧~