?
北京郵電大學軟件學院教授、圍棋軟件開發(fā)者劉知青
道與數(shù)
——“人機大戰(zhàn)對圍棋文化的影響”研討會
時間:2016年3月16日9:00—13:00
地 點:北京裕龍國際酒店第八會議室
主辦單位:《光明日報》國學版 國學網(wǎng)
邱運華(首都師范大學副校長):
今天我們所談?wù)摰模且粋€面向未來的嶄新話題。原來國學網(wǎng)也主辦過一些活動,比如《中國圍棋古譜集成》,是面向過去的整理;“國學杯”是面向業(yè)余棋界的比賽,等等。而本次座談會則是面向未來的一個活動,這是非常有意義的。
尹小林(首都師范大學電子文獻研究所所長):
這幾天我看了大賽的棋譜和一些媒體的報道,有三點感受:
第一是強者至上。在圍棋界,誰的水平高,誰就擁有更多發(fā)言權(quán)。此前計算機軟件水平不高,沒有多少發(fā)言權(quán)。這一次AlphaGo軟件出來以后,職業(yè)棋手就開始謙虛了。
現(xiàn)在討論比較多的,把計算機叫作圍棋上帝。從某種意義上講,計算機就是代表上帝和人在下棋,我的第一個感受就是計算機太強大了。
第二是大道至簡。最大的道理是最簡單的。今天我們還請了《周易》方面的專家,《周易》的“易”與對弈的“弈”是同音的,在古漢語里面,同音往往同義。當圍棋這么復(fù)雜的游戲可以簡化到用二進制來表述的時候,它就與《周易》相通了。
原先我們認為圍棋變化太多,無法計算,但是當我們找到一種算法時,情況就變了。前兩天一個計算機專業(yè)的朋友跟我透露了一個信息,他說現(xiàn)在AlphaGo已經(jīng)找到一種基于圖像的算法,直接計算棋形的面積,計算雙方棋子的面積。大道至簡,最復(fù)雜的東西用最簡潔的方法來表示,這就是計算機的基本原理。
第三是弱勢平衡。世界上不能只有強者,弱者和強者是共存共生的。比如王元老師是職業(yè)八段,我是業(yè)余三段,如果他讓到五六個子的時候,我們雙方力量就平衡了。實際上我們的文化也好,圍棋也好,《周易》也好,中醫(yī)也好,都在講平衡。這次人機大戰(zhàn)很大程度上是在逼迫我們?nèi)ニ伎細v史、現(xiàn)代和未來,我們需要從文化的角度去思考這次人機大賽的意義。
一
劉知青(北京郵電大學軟件學院教授、圍棋軟件開發(fā)者):
前年我寫過一本《現(xiàn)代計算機圍棋技術(shù)》,我在那本書里做了一個大膽預(yù)測,計算機圍棋會在五到十五年之內(nèi)戰(zhàn)勝頂尖職業(yè)棋手。這個可能是當時最大膽的預(yù)測了,沒有人相信。去年10月AlphaGo戰(zhàn)勝樊麾,但當時沒有公布。今年1月28日,他們的文章在頂級科學雜志《Nature》上發(fā)表,公布了這個事實。這遠遠超出我及同行們的一個最樂觀的估計:不是五到十五年,而是五到十五個月就已經(jīng)完成了。
《Nature》那篇文章非常重要,我仔細讀過它。那篇文章指出了一個很明確的方向,但是它沒有公布細節(jié)。所以別人要復(fù)制那些細節(jié)還是需要一定的工作量,這就像知道要這樣做才能爬到珠穆朗瑪峰,但你按著方法去爬,也不是十天半個月就能夠做到的。
這個團隊非常強大?!禢ature》那篇文章就有二十幾位作者,都是長期從事計算機工作的博士專家,最前沿的學者。主要人員都有十多年的計算機圍棋研究背景,有十多年的積累。陰謀論總是有的,但我看他們的論文,非常有說服力。而且,世界上能夠這樣戰(zhàn)勝李世石的,應(yīng)該是沒有的。在現(xiàn)場它不可能去作弊,它下棋的方法也不是人的方法,它做了很多交換,我們看來都是俗手,這些小細節(jié)不是最優(yōu),但它仍然可以碾壓李世石。李世石唯一的翻盤,只是計算機在那個時候犯了一個錯誤,而這個錯誤其實是它使用技術(shù)的一個特征。這個弱點恰恰說明這是一個軟件,是一個計算機。而且它的強項也是計算機的強項,不是人的強項。整個比賽過程應(yīng)該還是一個非常有說服力的技術(shù)的展現(xiàn)。
孫茂松(清華大學計算機系教授):
五六年前,微軟有一個華人學者,負責微軟的語音識別項目,他與我商量說能不能做個圍棋軟件。當時我覺得圍棋太復(fù)雜了,這也是業(yè)界的共識。我大概算了算,縱橫19道,361點,每個點都有白子、黑子、無子三種可能,這就是3361。算下來一盤棋有10172種可能。
林建超(中國圍棋協(xié)會副主席):
這是沈括在一千多年前記載在《夢溪筆談》里的,其實理論上還要比這個數(shù)字大得多。沈括當年不能掌握的,一個是組合的方法,第二個是滿空間的算法,第三個是黑白雙方運行,而且他不知道重復(fù)提子,這些東西當年都沒有計算在內(nèi)。所以一個點不是三種可能,而是無限種可能。
孫茂松:
反正很復(fù)雜。而且你還得把人類下得比較好的棋譜給它輸送進去,大學沒有這個工程能力,國內(nèi)科研體制下也沒有辦法拿到這個經(jīng)費。但是當最近兩三年卷積神經(jīng)網(wǎng)絡(luò)出來的時候,我的第一直覺就是:圍棋可以做了。因為卷積神經(jīng)網(wǎng)絡(luò)這幾年在語音識別、圖像識別上的進展突飛猛進。語音識別現(xiàn)在的錯誤率大概在9%,而以前要高得多。這是現(xiàn)在包括谷歌、微軟、百度在激烈競爭的一個領(lǐng)域。這個卷積神經(jīng)網(wǎng)絡(luò),即便是輸入一張最簡單的圖片,64×64的一個點陣,也比圍棋要復(fù)雜得多。
韓立新(清華大學哲學系教授、清華大學圍棋文化交流與研究基金會主席):
不好意思打斷你一下,是不是說在圖像識別這個技術(shù)上,人工智能已經(jīng)比人類高?
孫茂松:
對。把物品分成一千類,然后給一張照片,給五個答案去選。這個條件下,現(xiàn)在機器做得要比人好。因為這一千類中,有很多東西人可能不認識。比如這個花是什么花,你可能不認識,但機器有大數(shù)據(jù)的能力,就會做得比較好。卷積神經(jīng)網(wǎng)絡(luò)是一個通用模型,拿這個圖像數(shù)據(jù)去訓練,它就能把圖像識別做好,拿語音的去實驗,就能把語音識別做好,用圍棋數(shù)據(jù)去訓練,就能把圍棋做好。它根據(jù)整個盤面去計算,所以可以掌握所謂的“大勢”。但這個大的局面,它自己其實并不知道,它就是靠算法,變成一個函數(shù)。網(wǎng)絡(luò)本身可能很復(fù)雜,但整個結(jié)構(gòu)非常簡單。輸出是什么呢?輸出就是下一步棋,你落在某個格子里的概率。剛開始所有的參數(shù)都是隨機給,但當前這個盤面,黑白這個是定式,這個是有的,所有的參數(shù)往上算,算到最后那個輸出端,然后它去算落在每一個格上的概率。剛開始它不準,需要靠數(shù)據(jù)去重新反向訓練神經(jīng)網(wǎng)絡(luò),最后只要給個棋盤,我保證落在人類專家放的那個位置的概率是最大的。
畢達哥拉斯說:“數(shù)字是宇宙的統(tǒng)治者?!眹鍘缀鯖]有規(guī)則,全是靠計算,最終結(jié)果全是一組一組的數(shù)。所以AlphaGo輸棋不是BUG,是其模型本身的性質(zhì),可能出昏招,也可能出奇招。搜索空間這么大,人類棋手實際上形成了一種人類高級智慧所確定的搜索范圍,搜索空間大大縮小。而AlphaGo則是全空間搜索,有可能出一些人類無法想象的、匪夷所思的奇招,有可能觸碰到人類慣性思維的盲區(qū),對我們下棋會有所啟發(fā)。
這個模型除了圍棋,還可以做很多事。比如我的學生運用類似模型研發(fā)程序,訓練計算機作古詩。試舉一例,上句古人詩云“江上西風一棹歸”,下句計算機續(xù)曰“夕陽不見客舟低”。再舉一例,上句古人詩云“又聽西風墮葉聲”,下句計算機續(xù)曰“萬事盡隨天籟起”,又續(xù)云“天涯游子不勝情,江山滿眼愁多少,剩有心事緒未成”,意境、平仄、韻律都還不錯。
·凡注明來源為“??诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報郵箱:jb66822333@126.com