您當前的位置：體育新聞>體育快訊>

劉知青：圍棋人機大戰(zhàn)是人工智能技術(shù)的展現(xiàn)

?？诰W(wǎng)　http://mmkcvlj.cn　時間：2016-03-21 16:11

北京郵電大學軟件學院教授、圍棋軟件開發(fā)者劉知青

　　道與數(shù)

　　——“人機大戰(zhàn)對圍棋文化的影響”研討會

　　時間：2016年3月16日9：00—13：00

　　地點：北京裕龍國際酒店第八會議室

　　主辦單位：《光明日報》國學版國學網(wǎng)

　　邱運華（首都師范大學副校長）：

　　今天我們所談?wù)摰模且粋€面向未來的嶄新話題。原來國學網(wǎng)也主辦過一些活動，比如《中國圍棋古譜集成》，是面向過去的整理；“國學杯”是面向業(yè)余棋界的比賽，等等。而本次座談會則是面向未來的一個活動，這是非常有意義的。

　　尹小林（首都師范大學電子文獻研究所所長）：

　　這幾天我看了大賽的棋譜和一些媒體的報道，有三點感受：

　　第一是強者至上。在圍棋界，誰的水平高，誰就擁有更多發(fā)言權(quán)。此前計算機軟件水平不高，沒有多少發(fā)言權(quán)。這一次AlphaGo軟件出來以后，職業(yè)棋手就開始謙虛了。

　　現(xiàn)在討論比較多的，把計算機叫作圍棋上帝。從某種意義上講，計算機就是代表上帝和人在下棋，我的第一個感受就是計算機太強大了。

　　第二是大道至簡。最大的道理是最簡單的。今天我們還請了《周易》方面的專家，《周易》的“易”與對弈的“弈”是同音的，在古漢語里面，同音往往同義。當圍棋這么復(fù)雜的游戲可以簡化到用二進制來表述的時候，它就與《周易》相通了。

　　原先我們認為圍棋變化太多，無法計算，但是當我們找到一種算法時，情況就變了。前兩天一個計算機專業(yè)的朋友跟我透露了一個信息，他說現(xiàn)在AlphaGo已經(jīng)找到一種基于圖像的算法，直接計算棋形的面積，計算雙方棋子的面積。大道至簡，最復(fù)雜的東西用最簡潔的方法來表示，這就是計算機的基本原理。

　　第三是弱勢平衡。世界上不能只有強者，弱者和強者是共存共生的。比如王元老師是職業(yè)八段，我是業(yè)余三段，如果他讓到五六個子的時候，我們雙方力量就平衡了。實際上我們的文化也好，圍棋也好，《周易》也好，中醫(yī)也好，都在講平衡。這次人機大戰(zhàn)很大程度上是在逼迫我們?nèi)ニ伎細v史、現(xiàn)代和未來，我們需要從文化的角度去思考這次人機大賽的意義。

　　一

　　劉知青（北京郵電大學軟件學院教授、圍棋軟件開發(fā)者）：

　　前年我寫過一本《現(xiàn)代計算機圍棋技術(shù)》，我在那本書里做了一個大膽預(yù)測，計算機圍棋會在五到十五年之內(nèi)戰(zhàn)勝頂尖職業(yè)棋手。這個可能是當時最大膽的預(yù)測了，沒有人相信。去年10月AlphaGo戰(zhàn)勝樊麾，但當時沒有公布。今年1月28日，他們的文章在頂級科學雜志《Nature》上發(fā)表，公布了這個事實。這遠遠超出我及同行們的一個最樂觀的估計：不是五到十五年，而是五到十五個月就已經(jīng)完成了。

　　《Nature》那篇文章非常重要，我仔細讀過它。那篇文章指出了一個很明確的方向，但是它沒有公布細節(jié)。所以別人要復(fù)制那些細節(jié)還是需要一定的工作量，這就像知道要這樣做才能爬到珠穆朗瑪峰，但你按著方法去爬，也不是十天半個月就能夠做到的。

　　這個團隊非常強大?！禢ature》那篇文章就有二十幾位作者，都是長期從事計算機工作的博士專家，最前沿的學者。主要人員都有十多年的計算機圍棋研究背景，有十多年的積累。陰謀論總是有的，但我看他們的論文，非常有說服力。而且，世界上能夠這樣戰(zhàn)勝李世石的，應(yīng)該是沒有的。在現(xiàn)場它不可能去作弊，它下棋的方法也不是人的方法，它做了很多交換，我們看來都是俗手，這些小細節(jié)不是最優(yōu)，但它仍然可以碾壓李世石。李世石唯一的翻盤，只是計算機在那個時候犯了一個錯誤，而這個錯誤其實是它使用技術(shù)的一個特征。這個弱點恰恰說明這是一個軟件，是一個計算機。而且它的強項也是計算機的強項，不是人的強項。整個比賽過程應(yīng)該還是一個非常有說服力的技術(shù)的展現(xiàn)。

　　孫茂松（清華大學計算機系教授）：

　　五六年前，微軟有一個華人學者，負責微軟的語音識別項目，他與我商量說能不能做個圍棋軟件。當時我覺得圍棋太復(fù)雜了，這也是業(yè)界的共識。我大概算了算，縱橫19道，361點，每個點都有白子、黑子、無子三種可能，這就是3361。算下來一盤棋有10172種可能。

　　林建超（中國圍棋協(xié)會副主席）：

　　這是沈括在一千多年前記載在《夢溪筆談》里的，其實理論上還要比這個數(shù)字大得多。沈括當年不能掌握的，一個是組合的方法，第二個是滿空間的算法，第三個是黑白雙方運行，而且他不知道重復(fù)提子，這些東西當年都沒有計算在內(nèi)。所以一個點不是三種可能，而是無限種可能。

　　孫茂松：

　　反正很復(fù)雜。而且你還得把人類下得比較好的棋譜給它輸送進去，大學沒有這個工程能力，國內(nèi)科研體制下也沒有辦法拿到這個經(jīng)費。但是當最近兩三年卷積神經(jīng)網(wǎng)絡(luò)出來的時候，我的第一直覺就是：圍棋可以做了。因為卷積神經(jīng)網(wǎng)絡(luò)這幾年在語音識別、圖像識別上的進展突飛猛進。語音識別現(xiàn)在的錯誤率大概在9%，而以前要高得多。這是現(xiàn)在包括谷歌、微軟、百度在激烈競爭的一個領(lǐng)域。這個卷積神經(jīng)網(wǎng)絡(luò)，即便是輸入一張最簡單的圖片，64×64的一個點陣，也比圍棋要復(fù)雜得多。

　　韓立新（清華大學哲學系教授、清華大學圍棋文化交流與研究基金會主席）：

　　不好意思打斷你一下，是不是說在圖像識別這個技術(shù)上，人工智能已經(jīng)比人類高？

　　孫茂松：

　　對。把物品分成一千類，然后給一張照片，給五個答案去選。這個條件下，現(xiàn)在機器做得要比人好。因為這一千類中，有很多東西人可能不認識。比如這個花是什么花，你可能不認識，但機器有大數(shù)據(jù)的能力，就會做得比較好。卷積神經(jīng)網(wǎng)絡(luò)是一個通用模型，拿這個圖像數(shù)據(jù)去訓練，它就能把圖像識別做好，拿語音的去實驗，就能把語音識別做好，用圍棋數(shù)據(jù)去訓練，就能把圍棋做好。它根據(jù)整個盤面去計算，所以可以掌握所謂的“大勢”。但這個大的局面，它自己其實并不知道，它就是靠算法，變成一個函數(shù)。網(wǎng)絡(luò)本身可能很復(fù)雜，但整個結(jié)構(gòu)非常簡單。輸出是什么呢？輸出就是下一步棋，你落在某個格子里的概率。剛開始所有的參數(shù)都是隨機給，但當前這個盤面，黑白這個是定式，這個是有的，所有的參數(shù)往上算，算到最后那個輸出端，然后它去算落在每一個格上的概率。剛開始它不準，需要靠數(shù)據(jù)去重新反向訓練神經(jīng)網(wǎng)絡(luò)，最后只要給個棋盤，我保證落在人類專家放的那個位置的概率是最大的。

　　畢達哥拉斯說：“數(shù)字是宇宙的統(tǒng)治者?！眹鍘缀鯖]有規(guī)則，全是靠計算，最終結(jié)果全是一組一組的數(shù)。所以AlphaGo輸棋不是BUG，是其模型本身的性質(zhì)，可能出昏招，也可能出奇招。搜索空間這么大，人類棋手實際上形成了一種人類高級智慧所確定的搜索范圍，搜索空間大大縮小。而AlphaGo則是全空間搜索，有可能出一些人類無法想象的、匪夷所思的奇招，有可能觸碰到人類慣性思維的盲區(qū)，對我們下棋會有所啟發(fā)。

　　這個模型除了圍棋，還可以做很多事。比如我的學生運用類似模型研發(fā)程序，訓練計算機作古詩。試舉一例，上句古人詩云“江上西風一棹歸”，下句計算機續(xù)曰“夕陽不見客舟低”。再舉一例，上句古人詩云“又聽西風墮葉聲”，下句計算機續(xù)曰“萬事盡隨天籟起”，又續(xù)云“天涯游子不勝情，江山滿眼愁多少，剩有心事緒未成”，意境、平仄、韻律都還不錯。

[來源：光明日報] [作者：] [編輯：符德銘]

版權(quán)聲明：

·凡注明來源為“?？诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計等作品，版權(quán)均屬?？诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán)，不得進行一切形式的下載、轉(zhuǎn)載或建立鏡像。

·凡注明為其它來源的信息，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責。