?
圍棋變化無窮
Google DeepMind 實驗室的 AlphaGo 把歐洲圍棋冠軍樊麾干翻了,這條新聞都看過了吧,這里咱聊點兒不太一樣的東西。
首先,要說說圍棋是個什么游戲。規(guī)則很簡單,一人拿黑子一人拿白子,在棋盤 361 個交叉點上輪流下子,落子不得移動。一個點周圍的四個點都是“氣”,子周圍沒氣就死了,死棋則被拿走。在棋盤 361 個點下滿后,數(shù)數(shù)誰地盤大,誰就贏了??梢哉f,圍棋是一個“圈地游戲”。
最簡單的規(guī)則,最復(fù)雜的變化。
為什么這么重要呢?因為是機器第一次在這項競技游戲上勝過人類。雖然 1997 年超級計算機“深藍(lán)”戰(zhàn)勝了國際象棋世界冠軍卡斯帕羅夫,但圍棋一直被認(rèn)為是人工智能難以攻克的題目。
2013 年,日本電圣戰(zhàn)上,電腦圍棋 CrazyStone 打敗了石田芳夫九段(石田讓四子)。石田賽后評論 CrazyStone:“大約與業(yè)余六段水平相當(dāng)……天才??!”這次比賽算是電腦圍棋的一次小突破,但由于有讓子,算不上是真正的勝利。
在“通關(guān)”國際象棋之后,圍棋不可避免地成為了人工智能科學(xué)家要攀登的下一座山峰。不過許多媒體以及職業(yè)選手對此并不太在意,認(rèn)為計算機擊敗人類圍棋手幾乎是不可能的任務(wù)。許多媒體都曾發(fā)出如是論斷:
計算機要在圍棋上戰(zhàn)勝人類,再等100年吧!
接下來要說點復(fù)雜的東西
圍棋到底復(fù)雜在哪里?
參照維基百科上“游戲復(fù)雜度”詞條,可以通過兩種方式衡量棋類游戲的復(fù)雜性,一是狀態(tài)空間復(fù)雜度,二是博弈樹復(fù)雜度。
狀態(tài)空間復(fù)雜度:圍棋是 10 的 172 次方,中國象棋、國際象棋分別是 10 的 48 次方、46 次方。
博弈樹復(fù)雜度:圍棋是 10 的 300 次方,中國象棋、國際象棋分別是 10 的 150 次方、10 的 123 次方。
不多花篇幅解釋兩個名詞的內(nèi)涵,光看數(shù)字大小就知道圍棋的變數(shù)遠(yuǎn)遠(yuǎn)多于象棋,但這還不足以說明圍棋的復(fù)雜性。Facebook 智能圍棋負(fù)責(zé)人田淵棟在知乎上有此一說:
單單拿游戲的狀態(tài)個數(shù)去比較它們的難度是不準(zhǔn)確的。有很多狀態(tài)空間廣闊但是易解的例子。讓計算機投籃,出手的方向,速度,籃球的旋轉(zhuǎn),每個變量都是連續(xù)因而有無限可能,但是計算機試幾次之后很快就能找到最優(yōu)解……
圍棋難的地方在于它的估值函數(shù)非常不平滑,差一個子盤面就可能天翻地覆,同時狀態(tài)空間大,也沒有全局的結(jié)構(gòu)。這兩點加起來,迫使目前計算機只能用窮舉法并且因此進展緩慢。
圍棋本已復(fù)雜,計算機更是要將圍棋轉(zhuǎn)化為 0、1,再窮舉出所有可能的狀態(tài),最后進行決策——這項工作極為繁重。本次機器勝利意味著人們?yōu)檫@項工作找到了一個相對簡單的解決方案,但仍說不上是質(zhì)的突破。據(jù)愛范兒 CTO 何世友介紹,人工智能可以在三種情況下完爆人類棋手:
計算機性能無限強大,窮舉之;
計算機窮舉效率提高,高效窮舉之(如神經(jīng)網(wǎng)絡(luò));
新型計算機出現(xiàn)(如量子計算機)。
目前 Google 的 AlphaGo 正處在第二階段。另外世友還指出,不必過分解讀這次勝利——
人類處理 123+321=444 只需要三次運算,而計算機 CPU 需要進行上百次運算才能得出同樣的結(jié)果?,F(xiàn)在人工智能戰(zhàn)勝了人類棋手,是策略優(yōu)化和硬件運算速度提高共同作用的結(jié)果,換句話說,是人類戰(zhàn)勝了人類。與其惶惶論機器將征服人類,不如說得益于計算機的幫助,人類的諸多智慧能夠更快得到驗證,這對人類文明進步的提速將不可估量。20 世紀(jì)中葉以來,在計算機的幫助下數(shù)學(xué)家們解決了三大數(shù)學(xué)猜想之一的四色問題以及克卜勒猜想,這便是最好的佐證。
深度學(xué)習(xí)只是機器學(xué)習(xí)領(lǐng)域的一個分支。有趣的是,從近年機器學(xué)習(xí)領(lǐng)域的發(fā)展來看,似乎深度學(xué)習(xí)已經(jīng)統(tǒng)治了這個領(lǐng)域。這是一瓶好的萬精油。有意入機器學(xué)習(xí)坑的同學(xué)們趕快上,不要放過它。
·凡注明來源為“海口網(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報郵箱:jb66822333@126.com