首頁>要論>銳評 銳評
擊敗圍棋高手 人工智能仍沒人類聰明
近日,人工智能又一次成為媒體和公眾關注的焦點:谷歌旗下一家公司研制出的人工智能程序“阿爾法圍棋”(AlphaGo)在比賽中5:0完勝歐洲職業圍棋冠軍樊麾二段,在這種復雜度最高的棋類游戲上,人工智能顯示出有望超越人類頂尖高手的“智力”。今年3月,AlphaGo將挑戰世界冠軍李世石九段。 1997年,IBM開發的計算機程序“更深的藍”在六局棋比賽中,擊敗國際象棋棋王卡斯帕羅夫,成為載入史冊的人工智能突破。然而,圍棋的復雜度遠遠高于國際象棋,前者最多有10的約170次方種局面,后者的最多局面僅為10的約47次方種。近年來,人工智能有了什么發展,才有底氣與職業圍棋選手一較高下?它能否擊敗圍棋世界冠軍?如果擊敗,意味著什么?對于這些問題,專家給予了解答。
深度學習“消化” 2000萬局棋
復旦大學哲學學院教授、人工智能哲學專家徐英瑾介紹,傳統的計算機下棋程序的基本原理,是有限步數的搜索樹,即采用數學和邏輯推理方法,把每一種可能的路徑都走一遍,從中選出最優解。顯然,這種下棋思考方法是人類無法做到的,發揮了計算機速度快、運算量大的優勢。不過,這種“暴力算法”并不適用于圍棋。據計算,圍棋每回合有250種可能,一盤棋可長達150回合,所以圍棋最多有10的170次方種局面。即便對計算機而言,這個運算量也是相當大的。除了復雜度高,圍棋還有一大特點——黑白兩方棋的每個棋子是一樣的,沒有大小之分、角色之別。這給計算機程序的運算推理帶來了很大難度,因為從哲學上看,圍棋具有“語境敏感性”,不太適合邏輯推理; 而棋子各不相同的中國象棋、國際象棋具有“超語境性”,每個棋子角色明確,不因棋局的變化而改變,非常適合邏輯推理,這正是計算機的強項。近年來,不同于搜索樹的深度學習技術逐漸成熟,給圍棋程序的研發帶來了突破。深度學習源于人工神經網絡,其模仿對象是人腦。研究表明,人腦由約10的11次方個神經元構成,神經元細胞的外表有很多突起。其中,比較短的放射性突起叫“樹突”,外形似樹枝分叉,具有接受刺激并將沖動傳入細胞體的功能。而要把信息向其他神經元輸送,就得依靠“軸突”。人工神經網絡從信息處理角度對人腦神經元網絡進行了抽象和模擬,建立運算模型。這種網絡由大量模擬神經元的節點相互連接構成,每個節點代表一種特定的輸出函數,稱為激勵函數。每兩個節點間的連接,都代表一個對于通過該連接信號的權重值,形成人工神經網絡的記憶。網絡的輸出則根據連接方式、權重值和激勵函數的不同而不同。 “深度學習系統是人工神經網絡的升級版。”徐英瑾解釋說,這種系統由輸入層、中間層和輸出層構成,其中,中間層由多層人工神經網絡構成,可多達七八十層,故名為“深度學習”。每增加一層,就意味著增加了一個人工智能分析維度。當人把某種大數據樣本輸入系統后,這種系統即可進行學習,掌握樣本中蘊含的規律。為了讓 Al-phaGo具有一流的圍棋水平,谷歌科研人員輸入了2000萬局棋譜。假如一個人要學習2000萬局棋,每局棋耗時15分鐘,他需要一刻不停地下570年!
戰勝圍棋世界冠軍是遲早的事
Facebook 專家也在研發圍棋程序,但谷歌走在了他們前面。看了谷歌專家近日以封面形式發表在《自然》上的論文后,Facebook人工智能組研究員田淵棟博士表示,從算法上說,這篇文章并沒有太多新意,主要是通過大量訓練數據,包括以往的棋譜和自我對局,把性能“堆”出來。谷歌團隊訓練了一個走子的神經網絡,又訓練了一個可以評估局面的網絡,然后在“蒙特卡羅樹搜索”中同時使用這兩個網絡。香港科技大學計算機科學碩士陳經介紹,采用“蒙特卡羅樹搜索”這種算法,是圍棋程序在采用深度學習系統之前的一次突破。2010年左右,開發者們引入“蒙特卡羅樹搜索”,其特點是模擬棋局一直到下完算子、判斷勝負,模擬多次后,看哪個選點的獲勝概率最高。模擬時,會利用“棋形”等經驗減少選點,一直模擬下去直至終局。時間不夠或電腦計算能力不足,模擬的局面數就少,棋力就低。由此可見,這是一種基于概率的“暴力搜索”算法。如今,AlphaGo將“暴力搜索”與“大數據+深度學習”結合在一起,取得了突破。經過2000萬局“自我對局”訓練,它擁有了擊敗職業棋手的能力。“這個訓練規模,我實在沒有想到過,谷歌在這方面是很有優勢的。”田淵棟坦言,他們的“默認策略”也是經過處理的,能夠僅耗時2微秒就走一步,而且準確率也不錯。總之,谷歌的做法充分利用了“大數據+深度學習”的優勢,而且幾乎完全未用到圍棋的專業知識?!叭羰且院笃辶δ茉偻献撸乙膊粫@訝。” 不斷學習、不斷進步的Al-phaGo,今年能否戰勝李世石?華東師范大學計算機系賀樑教授認為,有這個可能,即使今年沒有戰勝,計算機程序擊敗圍棋世界冠軍也是遲早的事。這是因為,計算機的運算速度比人腦快得多,能憑借“大數據+深度學習”在短期內分析完一個人一生也無法窮盡的棋譜,棋力提升的速度和幅度會很驚人。
打造“通用人工智能” 需新算法
在不少人看來,如果 Al-phaGo擊敗圍棋世界冠軍,意味著人類將喪失在棋類游戲中最后的尊嚴。對此,徐英瑾認為大可不必妄自菲薄。從訓練棋局數量與圍棋水平的“投入/產出比”來看,人工智能還是沒有人類圍棋高手聰明。要知道,Al-phaGo可是訓練了2000萬局棋后,才能戰勝職業圍棋二段選手。而一個人在成長為職業九段高手前,訓練的棋局數量遠小于2000萬。從這個意義上說,人工智能程序的聰明程度遠不如大多數人,盡管擁有了深度學習能力,但它戰勝人類的主要原因仍和以前一樣:運算速度快、不受生物屬性限制。因此,我們不必沮喪,而是要為人工智能技術的進步感到欣喜。谷歌團隊表示,他們打算利用研發AlphaGo過程中的技術來解決一些當今社會的重要問題,如醫學診斷、全球變暖。自然語言理解,也是人工智能研發的一個重點領域。目前,代表這一領域國際先進水平的蘋果手機Siri,在與用戶對話時,仍顯得較為幼稚,有時答非所問。谷歌、Facebook、微軟、百度等許多知名互聯網企業都在投入重金,開展研發,以期在人機問答領域取得突破。徐英瑾表示,AlphaGo擊敗圍棋高手,也許還稱不上人工智能領域的重大突破。人工智能唯有能模仿“整全的人”,具備人類思維的大多數功能,才是真正震撼人心的事件。他分析說,計算機程序的許多單項能力早已超越人類,即使是一個小小的計算器,其算數能力也非人類可比。計算機程序如今成為圍棋高手,不過是增加了一種單項能力。與之相比,實現“通用人工智能”的難度高得多,要求一個人工智能系統,可以像人一樣做很多事情:做算術、寫文章、畫畫、下棋……這種系統能處理生活中紛繁復雜的情況,如果科學家能開發出一套優質的家政服務系統,能讓機器人獨立做各種家務,那么它就基本可算作通用人工智能。賀樑和徐英瑾都認為,“大數據+深度學習”技術并不能打造出通用人工智能系統,科技界需要開發出新的算法和技術,更好地模擬人腦工作方式,才有望把人工智能推向新的高度。(俞陶然)
編輯:劉文俊
關鍵詞:人工智能 擊敗圍棋高手“阿爾法圍棋”