2016年3月15日 星期二

我為什麼支持 AlphaGo:近距離觀察「AlphaGo背後推手」黃士傑【人工智能】

我為什麼支持 AlphaGo:近距離觀察「AlphaGo背後推手」黃士傑

編注:作者張曉茵是人機大戰中,代 AlphaGo 擺棋之黃士傑(Aja Huang)的學妹,同時也是台灣業餘五段、圍棋專欄作家。黃士傑是台灣師範大學資工博士,並且是開發 AlphaGo 的團隊核心人物之一。本文為她一路以來近距離觀察黃士傑 Aja Huang 為圍棋人工智慧所作出的努力。INSIDE 經張曉茵授權轉載
首先,看到 Google DeepMind 的電腦圍棋人工智慧 AlphaGo 戰勝樊麾二段的消息,的確有些意外,當然,也有一些恐懼。因為我知道樊麾的實力確實是職業棋手,而且是不會放水的,所以新聞一定是真的。
再來,看了各方圍棋界大量的在討論這則新聞,非常精彩!第一時間,我腦中立刻浮現出一個人:Aja Huang 黃士傑。2007 年我就讀台灣師範大學研究所期間,召集師大對圍棋有興趣的學弟妹來創辦圍棋社,當時聯繫到了就讀資訊工程研究所的 Aja 學長,他是業餘 段,也是唯一一位在圍棋社年紀比我大的學長,他很熱心地來指導學弟妹,有關於圍棋 AI 的知識都是那時聽他說的。
那時圍棋 AI 公認最強的程式是 Zen,大約業餘 段,而 Aja 學長所設計的程式 Erica 棋力也不俗,曾在榮獲 TAAI 2009 年電腦圍棋競賽 19 路銀牌及 路銅牌等佳績。Aja 學長的碩士跟博士論文都是在台灣師範大學資訊工程研究所林順喜教授的指導下完成,分別是 2003 年的碩士論文《電腦圍棋打劫的策略》(The Strategies for Ko Fight of Computer Go)和 2011 年的博士論文《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啓發式算法》(New Heuristics for Monte Carlo Tree Search Applied to the Game of Go),博士論文中 Rémi Coulom 為共同指導教授。
我在 2007 年時第一次聽 Aja 學長介紹蒙地卡羅樹搜尋法,我後來也上網查了一下,原理應該是:通過隨機抽樣的方法,以隨機事件出現的頻率估計其機率,或者以抽樣的數字特徵估算隨機變量的數字特徵,並將其作為問題的解。假設我們要計算一個不規則圖形的面積,那麼圖形的不規則程度和分析性計算的複程度是成正比的。
假想你有一袋豆子,把豆子均勻地朝這個圖形上撒,然後數這個圖形之中有多少顆豆子,這個豆子的數目就是圖形的面積。當你的豆子越小,撒的越多的時候,結果就越精確。藉助電腦程式可以生成大量均勻分布坐標點,然後統計出圖形內的點數,通過它們佔總點數的比例和坐標點生成範圍的面積就可以求出圖形面積。所以,Aja 學長說他們每天都餵程式吃很多職業棋士的棋譜,那時我隱約覺得,只要程式吃的棋譜夠多,一定能比人類還要強,沒想到,這天來的這麼快!
此外,這幾年他們可能還加入了 policy network 及 value network 等關鍵技術。這次 Nature 誌上關於AlphaGo 的論文,有心的人應該會發現,第一作者是 David Silver & Aja Huang(請見 Mastering the game of Go with deep neural networks and tree search)。
看到 Aja 學長也是 AlphaGo 的研發團隊之一,而且是並列第一作者,代表在團隊中的貢獻度不小,感到與有榮焉。我知道 Aja 學長博士畢業後到英國,2014 年曾托我買了整套 2013 年《圍棋天地》誌合刊本,專門寄到英國給他。Aja 學長為人低調,去年他加入 DeepMind 我也是最近才知道,而且在最近的報導中,他仍保持低調作風,一切貢獻以團隊為主,我在 Facebook 上想跟他多瞭解一些 AlphaGo 的訊息,他說是整個團隊的貢獻,而且很多事情目前都需要保密,等到三月跟李世九段比賽後之後才能說。
關於最近有網友發現在弈城上有一個 deepmind 的帳號,揣測是否就是用來測試 AlphaGo 程式的帳號。1 月 29 日,在台灣的書呆弈討論區中,Aja 學長已正式回應,那個帳號是他個人在使用的。原文如下:
「奕城的 deepmind 是我本人(Aja Huang)在用的帳號,並不是 AlphaGo,而且 deepmind 應該是在 14 年底之前、在 AlphaGo 團隊出現之前就創建了。如果我記得沒錯,我是在 Google 收購 DeepMind 之前就在奕城用 deepmind 下棋了,那時候我打到奕城 8d。我本人喜歡下圍棋,棋力是台灣業餘六段,去年在德國的比賽我甚至贏過一位日本職業棋手。但 AlphaGo 肯定是比我強太多了。」
「職業水平的圍棋軟體,應該最慢在 1-2 年之內就會在市面上普及。我相信 Zen 的作者目前正在全力實作我們公佈在 Nature 誌上的方法,或許 Zen 可以在不久的將來追上 AlphaGo,我個人十分樂見這樣的發展。我估評 7d 的 Ze n目前距離 5 個月前的 AlphaGo 還有 3 子以上的差距。」

依照 Aja 學長這樣的回覆,AlphaGo 的真正實力應該有職業水平,不容小覷。加上 Google 肯定是有一定的把握,從去年開始經過縝密的籌備及醖釀,直到今年初公開消息,是有完整準備的。當亞洲圍棋強國在為夢百合世界大賽冠軍爭奪時,英國的 DeepMind 團隊已悄然走在超越人類世界冠軍的道路上。
三月對戰李世,AlphaGo 研發團隊堅持不透漏各種保密協議的內容,這使我更看好 AlphaGo。我不是不支持人類,而是除了棋手個人的棋力強之外,我更相信人類集體智慧的結晶成果,即 Google DeepMind 團隊合作的智慧。
這裡我想說一個題外話,可能不是很重要,但是或許也可以從側面多瞭解一點線索。一般人會覺得電腦工程師一定是整天面對著電腦和大量的數據,思考必須非常理性。能夠開發出打敗人類的圍棋程式,研發者的思維一定非常嚴謹,做事一板一眼。但是接觸了 Aja 學長,發現並不是這麼回事。他們也是人,而且,Aja 學長還很喜歡音樂,甚至自己能夠用 MIDI 作曲並彈奏。我自己從小一直是學音樂的,聽到 Aja 學長的作品都覺得有專業水平,而且非常感性,我今天翻出來聽都還是耐人尋味。我在想,這樣一位理性感性兼備的電腦工程師所在的團隊,其開發出來的電腦程式,或許會想過把一些人性的元素放進去。
很高興,Google 團隊裡有這麼一位台灣人,Aja 學長說要低調,因為 AlphaGo的團隊成員很多,不是他一個人做出來的。但是,為什麼我們不能說,AlphaGo 的團隊成員很多,但是其中有一位台灣人,而且擁有業餘6段的棋力也是團隊中棋力最高的,可謂「台灣之光」!身為師大校友、台灣人,甚至亞洲人,Aja Huang 能在英國的團隊中貢獻所學,都應該為之喝采。此時,是否我們可以用一種更寬大的胸懷,這群研發團隊代表人類突破了圍棋人工智慧,大家應該共同身為如此神奇的人類而讚嘆。就算 AlphaGo 至今尚未打敗人類世界冠軍,但我相信這一天並不會太久,我樂見其成。
《延伸閱讀》
李開復:人工智慧對人類真正的威脅是什麼? 

沒有留言:

張貼留言

MIT黃金創業課:做對24步,系統性打造成功企業【創業】

Step0   起點 Step1   市場區隔 Step2   灘頭堡市場 Step3   終端使用者檔案 Step4   灘頭堡的總市場規模 Step5   代言人 Step6   生命週期使用案例 Step7   高層次的產品規格 Step8   量化價值主張 Step9  ...