AlphaGo首盤完勝李世石 人工智能取得劃時代勝利
谷歌的人工智能程序AlphaGo與世界頂尖職業棋手李世石,昨天戰罷第一盤。精于官子的李世石在官子階段投枰認負。雖然后面還有4盤比賽,李世石仍有證明自己的機會,但對于人工智能,1比0已是劃時代的勝利。第二盤比賽將在今天中午繼續進行。
教會徒弟餓死師傅
這次比賽前,谷歌程序設計者哈薩比斯承認,他們曾找來目前所有職業棋手的棋譜,供程序學習。也就是說,李世石其實是AlphaGo的師傅之一。但教會了徒弟,真就餓死了師傅。
李世石曾試圖給AlphaGo一個驚喜。在猜先獲勝后,他少見地選擇執黑先行,并在開局選擇了自己從未嘗試過的下法。但這一招并沒有完全戳中AlphaGo的軟肋。AlphaGo前一個小時的表現,得到了專業棋手“不像計算機下的棋”的評價。
后來,AlphaGo出現了一次嚴重錯誤,而李世石越下越順,在棋盤左下角出現了巨大優勢。穩住陣腳的李世石,還去上了一次廁所。但此后一個失誤,就被AlphaGo抓住,下出勝負手。李世石應對不利,轉眼落入下風。官子階段李世石感覺在計算方面超不過電腦,索性認輸。
阿爾法還只是單機版
作為歷史上第一個擊敗了職業頂級圍棋手的程序,AlphaGo帶來的震驚不止于表面的輸贏。比如,這次的程序,還只是單機版。
據悉,此次人機大戰,谷歌沒有使用分布式系統,只是使用單獨的計算機,與和樊麾比賽時的性能是一樣的。在谷歌發表在自然雜志上的論文中提到,運行程序的計算機,裝有48個CPU和8個GPU。
但AlphaGo是在云計算平臺上運行的。為了達到更高的運算能力,谷歌曾把AlphaGo接入到了1202個CPU組成的網絡之中,聯網后的AlphaGo算力猛增24倍。
而且谷歌目前仍在攻關用網絡分布式提升程序性能。DeepMind創始人哈薩比斯解釋說:“目前分布式對單機的勝率只有70%,所以最后還是決定使用單機參賽。”
也就是說,這次橫空出世的谷歌大殺器,還有無限的進步空間。在首盤獲勝后,AlphaGo的設計者介紹,人類在學習圍棋的過程中會有導師指導,而AlphaGo除了已有的數據以外,并沒有導師來告訴它哪一步棋是正確的。“包括這次比賽,很多棋并沒有出現在程序曾經學習過的棋譜中。”
1比0的劃時代意義
奮戰3個小時后,李世石落敗。之后他獨自一人坐在棋盤前,默默復盤。賽后他說,自己在隨后的比賽中還有勝算。但對機器來說,首盤獲勝后,就幾乎已經獲得了想要的一切。
在AlphaGo首盤獲勝后,網絡上無論是押分的還是押錢的,無不把籌碼移向了機器一方。創新工坊創始人李開復在分析棋局時認為,谷歌之所以選擇圍棋,是因為圍棋技藝中所體現的東方思維,大局、判斷、棄取、轉換,這些不是單靠計算力可以解決的領域,是之前的人工智能發展瓶頸。
但如今程序已經證明,可以用算法解決這些務虛的問題。而接下來以程序的穩定性,棋局起伏的可能性已經不大。比如,雖然李世石布局就下出“怪招”黑7,程序依然應對得當。白24-28在職業棋手看來是“俗手”,然而觀戰的古力也承認看著難看但效果有力。到盤中程序通過勝負手攪出勝機,更是超出了李世石的想象。
賽后李世石調整了情緒后表示,程序有兩點令他震驚:“首先是打開局面的能力,我曾經預想布局對AlphaGo是個難點,沒想到結果很令自己意外。后面是對雙方都很難的局面。另外,作為人來看,沒有很強計算力是不敢下出來的棋,AlphaGo都能下出來,很令人驚訝。”這樣的評論,從目前圍棋頂尖人物口中說出,也是對人工智能程序的莫大肯定。
評論果然亮了
一場大戰吸引世界的目光。每逢大事發生,底下的評論也肯定精彩。比如轉發量最高的評論是:“谷歌做的這個機器人,真的像人哎。”
其實,坐在李世石對面擺棋的,是程序設計團隊成員黃士杰(Aja Huang),代替AlphaGo在棋盤上落子。更多的評論,表達了人類的震驚。作為李世石的老對手,“中國圍棋第一人”柯潔九段先是意氣用事地發微博說:“就算阿法狗戰勝了李世石,但它贏不了我!”隨后冷靜下來的他分析稱:“李世石的強項是后半盤的翻盤能力,布局則是李世石最差的地方,判斷力也不是太好,這對于AlphaGo來說是個重大利好。所以李世石的棋風并不是最適合和計算機比賽,AlphaGo有一定的機會。”
AlphaGo的團隊,用高冷的方式表達著喜悅。他們第一時間登錄社交網絡發表感慨:“我們像登上了月球一樣。”
雖然還有4盤比賽,但創新工場的李開復對李世石,乃至人類棋手的前景看衰。“在過去‘深藍’的時代,雖然成長很快,但還是經歷了無數次的失敗,通過不斷學習才戰勝了國際象棋世界冠軍卡斯帕羅夫。‘深藍’為此花了4年,我覺得AlphaGo只需要一年就夠了。”李開復和柯潔誰說的對,今天李世石和AlphaGo的第二盤比賽,也許能夠回答。
文/本報記者 褚鵬