您當(dāng)前的位置：體育新聞>體育快訊>

人類如何反轉(zhuǎn)？人工智能專家給李世石出點(diǎn)招

?？诰W(wǎng)　http://mmkcvlj.cn　時(shí)間：2016-03-10 15:43

人類代表李世石

　　如果說1997年IBM深藍(lán)戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫是機(jī)器突破了人類的第一道防線話，2016年AlphaGo是不是摧毀了人類的最后一點(diǎn)驕傲呢？

　　雖然作為多年的AI工作者，是AI的堅(jiān)定支持者，我還是覺得人類的最后一道防線可以多堅(jiān)守一段時(shí)間。那么，我來給李世石出點(diǎn)招吧。

　　這一切的一切，還是得先從AlphaGo的原理講起。

　　原理：AlphaGo如何運(yùn)作？

　　區(qū)別于國(guó)際象棋靠推演，圍棋需要靠“感覺”。圍棋變化太多了，每一步棋可以有多達(dá)300多種選擇。僅僅推演6-7步，就已經(jīng)是現(xiàn)在計(jì)算機(jī)所不能及，更不用說人。所以，即便是人，在很多場(chǎng)景下都要靠感覺來決定下一步往哪里走。這種“感覺”，靠的是智力。

　　AlphaGo基于當(dāng)今最領(lǐng)先的“深度學(xué)習(xí)”技術(shù)，來建立機(jī)器的智力。當(dāng)前的這種人工智能技術(shù)，是一種仿生學(xué)技術(shù)，運(yùn)用數(shù)學(xué)模型去模仿人類的大腦。這種機(jī)器大腦，在面對(duì)棋局時(shí)也可以“感覺”出情勢(shì)的好壞。而“感覺”的好壞體現(xiàn)的就是智力水平。

　　那么，智力水平怎么比拼呢？通常我們數(shù)“腦細(xì)胞”的數(shù)量。就像人的腦細(xì)胞比狗多，所以人比狗聰明；狗的腦細(xì)胞比蟑螂多，所以狗比蟑螂聰明。4年前，Google就研發(fā)出了一個(gè)腦細(xì)胞數(shù)量達(dá)到百萬量級(jí)的大腦Google Brain，能識(shí)別出貓臉。為此Google動(dòng)用了1000+臺(tái)服務(wù)器。

　　如果要讓機(jī)器大腦更聰明怎么辦？一個(gè)直接的辦法就是，增加服務(wù)器。服務(wù)器數(shù)量增加10倍，腦細(xì)胞數(shù)量就能增加10倍，機(jī)器大腦就更聰明了。

　　所以，AlphaGo有多聰明，主要看它有多少“腦細(xì)胞”。“腦細(xì)胞”的數(shù)量，主要看投入了多少計(jì)算資源。

　　能力：AlphaGo有多厲害？

　　AlphaGo的智力水平肯定是不如人的。

　　4年前的Google Brain，腦細(xì)胞數(shù)量是人的萬分之一。雖然時(shí)過進(jìn)遷，但Google的投入仍然不可能達(dá)不到當(dāng)年一萬倍。從第一盤比賽中，也可以看得出來，李世石在開局和布局是占有優(yōu)勢(shì)的。

　　第一盤棋中，真正讓人感到害怕的也不是AlphaGo的棋力，而是它的沒有情緒、不知疲倦、沉著冷靜。這與AI無關(guān)，是機(jī)器的本性。

　　情緒、體力、心理波動(dòng)等人性弱點(diǎn)對(duì)棋局結(jié)果的影響不可低估。事實(shí)上，李世石并不輸在棋力，而是輸在獲得優(yōu)勢(shì)以后的輕敵，以及之后所犯的錯(cuò)誤。

　　勝機(jī)：李世石還有機(jī)會(huì)么？

　　雙方對(duì)比來看，李世石比AlphaGo聰明，棋力更深厚。AlphaGo比李世石的人性弱點(diǎn)：情緒控制更好，它不會(huì)緊張，不會(huì)嘚瑟，不會(huì)沮喪，也不會(huì)體力下降。李世石面對(duì)的其實(shí)是一位棋力比他稍差的忍者。好在，他是占據(jù)主動(dòng)的一方。在棋力占優(yōu)的情況下，只要不犯錯(cuò)誤，是可以立于不敗之地的。

　　綜合來看，我仍然看好李世石。

　　和AlphaGo對(duì)抗時(shí)，人類需要注意的是：

　　1、AlphaGo所基于的人工智能技術(shù)，強(qiáng)項(xiàng)不在于推演，而是借鑒過去見過的局面。所以，如果要擊敗AlphaGo，需要盡可能把局面導(dǎo)向歷史上沒人下過的棋。

　　2、圍棋的邊角戰(zhàn)斗靠計(jì)算，中空戰(zhàn)斗靠感覺。既然感覺占優(yōu)，那就一定要盡量把勝負(fù)手留在棋盤中間（或許武宮正樹更適合pk AlphaGo？）?？孔觥皠?shì)”取勝，而不是把戰(zhàn)火引到邊角實(shí)地。

　　3、一旦進(jìn)入到局部纏斗，盡早將局部肉搏戰(zhàn)打完，不要留出大量小區(qū)域短兵相接的局面，保持局面盡可能大開大合。

　　此外，需要格外小心的是，一定要克服自己人性的弱點(diǎn)。局面領(lǐng)先時(shí)，避免驕傲；落后時(shí)，避免氣餒；膠著時(shí)，避免緊張。

　　李世石如果能在后面幾局注意控制自己的心魔：那么不僅可以沉著冷靜，也可以小宇宙爆發(fā)。相信后面還是有很大機(jī)會(huì)可以扳回。

　　總的來說，要戰(zhàn)勝AlphaGo：

　　1、準(zhǔn)備歷史上沒下過的布局；

　　2、把勝負(fù)手留在棋盤中間；

　　3、不留短兵相接的局面；

　　4、控制自己的心魔。

　　還有一點(diǎn)，可能是李世石犯的錯(cuò)誤，但已無法改變了。據(jù)說，他要求下快棋。AlphaGo系統(tǒng)的分為兩個(gè)部分，一是學(xué)習(xí)，二是對(duì)弈。其中，學(xué)習(xí)的部分是最耗時(shí)間和資源的，而對(duì)弈部分相對(duì)計(jì)算沒那么大。要限制AlphaGo，應(yīng)該要限制它的學(xué)習(xí)時(shí)間，而不是對(duì)弈時(shí)的思考時(shí)間。特別是，對(duì)于AlphaGo這樣的分布式系統(tǒng)，Google完全可以通過增加一倍服務(wù)器數(shù)量來讓落子速度倍增，而李世石是不可能給自己的大腦擴(kuò)容的。其實(shí)，最好的限制AlphaGo的辦法是盡早與他對(duì)弈，不讓他繼續(xù)學(xué)習(xí)下去：）

　　據(jù)說，柯潔已經(jīng)發(fā)話說，AlphaGo下不過自己了。如果柯潔要鞏固自己的優(yōu)勢(shì)，建議如下。

　　建議

　　1、盡早與AlphaGo對(duì)弈

　　2、下慢棋

　　3、或者還有一個(gè)不靠譜的招，改一下規(guī)則，下20*20的棋：）

　　投入：AlphaGo花了多少錢？

　　最后，我想一個(gè)有意思的話題是，AlphaGo到底花了Google多少錢：）

　　從今天雙方在棋力上的差距來看，差距已經(jīng)不是很大了。只要Google愿意多投入5-10倍的資源，AlphaGo的棋力應(yīng)該可以超越人類了。要達(dá)到這樣的智力水平，我想Google應(yīng)該至少投入了數(shù)億美金的資源。

　　隨著技術(shù)水平的提升，和投入的加大，大概只需要1~2年，AlphaGo在棋力上應(yīng)該也可以超越人類。

　　寫到這里，我其實(shí)還是很羨慕AlphaGo團(tuán)隊(duì)的科學(xué)家的，他們有一個(gè)很好的sponsor，能給他們一個(gè)環(huán)境去完成一件劃時(shí)代的壯舉——我何嘗不曾想擁有這樣的環(huán)境——3年前我和我的老師楊強(qiáng)提出的圍棋方案找不到sponsor的場(chǎng)景仍然歷歷在目。

　　不過，后來我也想明白一個(gè)事情。其實(shí)我們的大環(huán)境缺的并不是有理想有抱負(fù)的科學(xué)家，而是sponsor。所以真正挑戰(zhàn)人類的其實(shí)是IBM，不是許峰雄；是Google，不是DeepMind團(tuán)隊(duì)。就像，真正修成圣彼得大教堂的，是天主教會(huì)，而不是米開朗基羅。

　　這也是為什么，我決定要做第四范式————中國(guó)有好的科學(xué)家，但缺好的sponsor。

[來源：新浪體育] [作者：戴文淵] [編輯：符德銘]

版權(quán)聲明：

·凡注明來源為“?？诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計(jì)等作品，版權(quán)均屬?？诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán)，不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。

·凡注明為其它來源的信息，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。