?
人類代表李世石
如果說1997年IBM深藍(lán)戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫是機(jī)器突破了人類的第一道防線話,2016年AlphaGo是不是摧毀了人類的最后一點(diǎn)驕傲呢?
雖然作為多年的AI工作者,是AI的堅(jiān)定支持者,我還是覺得人類的最后一道防線可以多堅(jiān)守一段時(shí)間。那么,我來給李世石出點(diǎn)招吧。
這一切的一切,還是得先從AlphaGo的原理講起。
原理:AlphaGo如何運(yùn)作?
區(qū)別于國(guó)際象棋靠推演,圍棋需要靠“感覺”。圍棋變化太多了,每一步棋可以有多達(dá)300多種選擇。僅僅推演6-7步,就已經(jīng)是現(xiàn)在計(jì)算機(jī)所不能及,更不用說人。所以,即便是人,在很多場(chǎng)景下都要靠感覺來決定下一步往哪里走。這種“感覺”,靠的是智力。
AlphaGo基于當(dāng)今最領(lǐng)先的“深度學(xué)習(xí)”技術(shù),來建立機(jī)器的智力。當(dāng)前的這種人工智能技術(shù),是一種仿生學(xué)技術(shù),運(yùn)用數(shù)學(xué)模型去模仿人類的大腦。這種機(jī)器大腦,在面對(duì)棋局時(shí)也可以“感覺”出情勢(shì)的好壞。而“感覺”的好壞體現(xiàn)的就是智力水平。
那么,智力水平怎么比拼呢?通常我們數(shù)“腦細(xì)胞”的數(shù)量。就像人的腦細(xì)胞比狗多,所以人比狗聰明;狗的腦細(xì)胞比蟑螂多,所以狗比蟑螂聰明。4年前,Google就研發(fā)出了一個(gè)腦細(xì)胞數(shù)量達(dá)到百萬量級(jí)的大腦Google Brain,能識(shí)別出貓臉。為此Google動(dòng)用了1000+臺(tái)服務(wù)器。
如果要讓機(jī)器大腦更聰明怎么辦?一個(gè)直接的辦法就是,增加服務(wù)器。服務(wù)器數(shù)量增加10倍,腦細(xì)胞數(shù)量就能增加10倍,機(jī)器大腦就更聰明了。
所以,AlphaGo有多聰明,主要看它有多少“腦細(xì)胞”。“腦細(xì)胞”的數(shù)量,主要看投入了多少計(jì)算資源。
能力:AlphaGo有多厲害?
AlphaGo的智力水平肯定是不如人的。
4年前的Google Brain,腦細(xì)胞數(shù)量是人的萬分之一。雖然時(shí)過進(jìn)遷,但Google的投入仍然不可能達(dá)不到當(dāng)年一萬倍。從第一盤比賽中,也可以看得出來,李世石在開局和布局是占有優(yōu)勢(shì)的。
第一盤棋中,真正讓人感到害怕的也不是AlphaGo的棋力,而是它的沒有情緒、不知疲倦、沉著冷靜。這與AI無關(guān),是機(jī)器的本性。
情緒、體力、心理波動(dòng)等人性弱點(diǎn)對(duì)棋局結(jié)果的影響不可低估。事實(shí)上,李世石并不輸在棋力,而是輸在獲得優(yōu)勢(shì)以后的輕敵,以及之后所犯的錯(cuò)誤。
勝機(jī):李世石還有機(jī)會(huì)么?
雙方對(duì)比來看,李世石比AlphaGo聰明,棋力更深厚。AlphaGo比李世石的人性弱點(diǎn):情緒控制更好,它不會(huì)緊張,不會(huì)嘚瑟,不會(huì)沮喪,也不會(huì)體力下降。李世石面對(duì)的其實(shí)是一位棋力比他稍差的忍者。好在,他是占據(jù)主動(dòng)的一方。在棋力占優(yōu)的情況下,只要不犯錯(cuò)誤,是可以立于不敗之地的。
綜合來看,我仍然看好李世石。
和AlphaGo對(duì)抗時(shí),人類需要注意的是:
1、AlphaGo所基于的人工智能技術(shù),強(qiáng)項(xiàng)不在于推演,而是借鑒過去見過的局面。所以,如果要擊敗AlphaGo,需要盡可能把局面導(dǎo)向歷史上沒人下過的棋。
2、圍棋的邊角戰(zhàn)斗靠計(jì)算,中空戰(zhàn)斗靠感覺。既然感覺占優(yōu),那就一定要盡量把勝負(fù)手留在棋盤中間(或許武宮正樹更適合pk AlphaGo?)??孔觥皠?shì)”取勝,而不是把戰(zhàn)火引到邊角實(shí)地。
3、一旦進(jìn)入到局部纏斗,盡早將局部肉搏戰(zhàn)打完,不要留出大量小區(qū)域短兵相接的局面,保持局面盡可能大開大合。
此外,需要格外小心的是,一定要克服自己人性的弱點(diǎn)。局面領(lǐng)先時(shí),避免驕傲;落后時(shí),避免氣餒;膠著時(shí),避免緊張。
李世石如果能在后面幾局注意控制自己的心魔:那么不僅可以沉著冷靜,也可以小宇宙爆發(fā)。相信后面還是有很大機(jī)會(huì)可以扳回。
總的來說,要戰(zhàn)勝AlphaGo:
1、準(zhǔn)備歷史上沒下過的布局;
2、把勝負(fù)手留在棋盤中間;
3、不留短兵相接的局面;
4、控制自己的心魔。
還有一點(diǎn),可能是李世石犯的錯(cuò)誤,但已無法改變了。據(jù)說,他要求下快棋。AlphaGo系統(tǒng)的分為兩個(gè)部分,一是學(xué)習(xí),二是對(duì)弈。其中,學(xué)習(xí)的部分是最耗時(shí)間和資源的,而對(duì)弈部分相對(duì)計(jì)算沒那么大。要限制AlphaGo,應(yīng)該要限制它的學(xué)習(xí)時(shí)間,而不是對(duì)弈時(shí)的思考時(shí)間。特別是,對(duì)于AlphaGo這樣的分布式系統(tǒng),Google完全可以通過增加一倍服務(wù)器數(shù)量來讓落子速度倍增,而李世石是不可能給自己的大腦擴(kuò)容的。其實(shí),最好的限制AlphaGo的辦法是盡早與他對(duì)弈,不讓他繼續(xù)學(xué)習(xí)下去:)
據(jù)說,柯潔已經(jīng)發(fā)話說,AlphaGo下不過自己了。如果柯潔要鞏固自己的優(yōu)勢(shì),建議如下。
建議
1、盡早與AlphaGo對(duì)弈
2、下慢棋
3、 或者還有一個(gè)不靠譜的招,改一下規(guī)則,下20*20的棋 :)
投入:AlphaGo花了多少錢?
最后,我想一個(gè)有意思的話題是,AlphaGo到底花了Google多少錢:)
從今天雙方在棋力上的差距來看,差距已經(jīng)不是很大了。只要Google愿意多投入5-10倍的資源,AlphaGo的棋力應(yīng)該可以超越人類了。要達(dá)到這樣的智力水平,我想Google應(yīng)該至少投入了數(shù)億美金的資源。
隨著技術(shù)水平的提升,和投入的加大,大概只需要1~2年,AlphaGo在棋力上應(yīng)該也可以超越人類。
寫到這里,我其實(shí)還是很羨慕AlphaGo團(tuán)隊(duì)的科學(xué)家的,他們有一個(gè)很好的sponsor,能給他們一個(gè)環(huán)境去完成一件劃時(shí)代的壯舉——我何嘗不曾想擁有這樣的環(huán)境——3年前我和我的老師楊強(qiáng)提出的圍棋方案找不到sponsor的場(chǎng)景仍然歷歷在目。
不過,后來我也想明白一個(gè)事情。其實(shí)我們的大環(huán)境缺的并不是有理想有抱負(fù)的科學(xué)家,而是sponsor。所以真正挑戰(zhàn)人類的其實(shí)是IBM,不是許峰雄;是Google,不是DeepMind團(tuán)隊(duì)。就像,真正修成圣彼得大教堂的,是天主教會(huì),而不是米開朗基羅。
這也是為什么,我決定要做第四范式————中國(guó)有好的科學(xué)家,但缺好的sponsor。
·凡注明來源為“??诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計(jì)等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報(bào)郵箱:jb66822333@126.com