2014年11月4日 星期二

大數據的未來:機器人的世界,還是人類的機器世界?【大數據】

我們可以這樣問自己一個問題:我們追求的是自動化還是智能化?

這結論很讚。

大數據的未來:機器人的世界,還是人類的機器世界?
2014年11月03日我要評論

人類從未對自己的認知能力滿意過。也正因為此,過目不忘,一目十行,上知天文下知地理,一直被看做是人類進階版本的一個典範。
計算機早就做到了這一點。

最近,在阿里巴巴的數據開放日中,我會面了數位數據科學家。當他們描述大數據未來能力的時候,我就會想到人類的局限。認知科學的未來,必然是計算機與人類的完美結合。但是,這個結合,應該是什麼樣的?

數據越來越多,而人類的解讀能力是固定的,人會累,會無法完全理性。但是計算機不會。計算機可以幫助人類找到自己的盲點。 IBM Watson實驗室的首席工程師Bowen Zhou告訴我,在Watson的醫療項目中,人類要閱讀十年的論文,計算機只需要30分鐘就可以讀完。曾任職Axciom的徐玲告訴我,在非常早期的時候,美國兩個很大的圖書館,以及梵蒂岡圖書館的數據化已經完成了。

這兩件事都指向一個結論:當我們找到的科技能力,正好能彌補人類的缺點,這之間隱藏著巨大的價值。實現的關鍵在於數據化。數據化讓計算機和人類得以溝通和結合。
記憶力一直不是人類最關鍵的東西,甚至說,是最薄弱的一環。邏輯,才是人類的認知關鍵,邏輯的產生源於經驗的積累和推演。如果計算機能夠幫助人類獲取更多的經驗,將有助於更強大邏輯的產生。

我曾經非常喜歡Evernote這個應用軟件。它可以記錄我所有片段的思考,同時收藏資料和文章。如果有一天,這個軟件可以通過“機器學習”我的記錄文檔,向我推薦值得閱讀的資料,幫助我瞬間搜索信息,提煉觀點,是否將會改變人類的認知習慣?

未來有可能實現麼?至少眼下,我們已經看到了一些進展,數據正在幫助我們看到盲點。我總結了數據開放日中各路英雄的核心觀點,希望能夠對你有所啟發。

NO 1 認知科學可能是未來很關鍵的能力
未來數據的價值不在於多少,而在於你是否有提煉的能力。 Watson正在推進的健康項目中,計算機能夠做到通過大數據來判斷未來治療的癌症方向,並且就此判斷更為精準的治療方法。

以往我們是怎麼做的呢?我們成千上萬的醫療專家,通過閱讀和研究大量的文獻、實驗和試錯,推演出可能的方向。這需要消耗十年,甚至更長的時間。而計算機只需要三十分鐘就可以閱讀完所有的相關文獻,迅速判斷有用信息。這是用認知科學來節省人類在醫療方面的時間和精力。

NO 2 紅酒與壽司:整合“實時數據”與“歷史數據”
將“實時數據”與“歷史數據”整合已經成為了業界共識。徐玲這樣比喻說,“歷史數據”如同紅酒,越陳越好。 “實時數據”如同壽司,越新鮮越好,兩者搭配,乃是絕妙。
而今我們對數據的處理上,也需要面對“實時數據”和“歷史數據”結合的問題。舉個例子,如果你在淘寶搜索茶葉,推薦系統應該從歷史數據中推薦各式茶葉,還是應該結合當前你的購物車數據,推薦更適合你的偏好品牌?

數據的結合併不容易,不僅要求不同數據的格式和標準統一化,更要求對於歷史數據與新數據結合後所產生對當下的理解和認知。
“就像是開飛機,我們通過歷史數據來判斷航道,但當時的風和氣候都很重要對駕駛有影響。實時數據越對你敏感,就價值越高。最終你通過設定預期軌跡和實時調整,獲得了最安全高效省錢的結果。實時和歷史數據的結合意味著更好的計劃和更快的反應。”

NO3 大數據也需要人的互補
Aaron Ling是Ancestry公司的總工程師,他在論壇上畫了一個巨大的家族譜系圖。這就是他正在做的項目,用大數據來清晰美國的家族圖譜。人們通過網站查閱相關的家族譜系,然後通過UGC的方式給出修改或者添加數據。這個模式將可能會對未來的醫療以及社會研究產生巨大的影響。

這個項目證明了大數據推演出的結果有時候也需要人的互補。因為經過人的信息互動,才有可能產生超出於人類的東西。人的互動可以讓大數據變得更靈活,更實在。

在實際操作中,我們可能會遇到這樣的情況:儘管你擁有很多數據,但是你還是無法獲得某個人的完整網絡行為信息。所以我們需要用一些算法把這個“數據漏洞”填住。來自Samsung的演講嘉賓Junlin Hu這樣形容這種困惑:“如果我們把人看做一個個的列,你會發現每個人其實沒買多少東西,大部分商品和人之間的連接是空白的。”

也因此,當我們在使用數據的時候,會發現大數據中有很多的漏洞,數據多而稀決。
在這種情況下,我們只能用算法解決,或者用“人為操作”的方式解決。

NO 4 到底未來是AI世界,還是IA世界
IBM 沃森實驗室的技術負責人Bowen Zhou在會議中提到了一個概念,從AI到IA的轉移。一直以來,IBM致力於創造能夠媲美人類智力的機器人,比如“深藍”,比如“沃森”。而現在,他們認為以人類為中心,強大輔助功能的計算機可能更有市場。

AI與IA的區別在於,前者以計算為中心,後者以人類為中心。就是說未來是“機器人的世界”,還是“人類的機器世界”?佔據主導地位的是會思考的機器人,還是輔助人類的機器?
未來的谷歌眼鏡,可能可以讓我們看到很遠,立即回饋三百公里以外的信息,但是他不是機器人。

又或者人可以擁有強大的機械手,很厲害的汽車、飛機。但是他們以人類而不是以機器為中心。這兩者的區別,是值得思考的。

或者,我們可以這樣問自己一個問題:我們追求的是自動化還是智能化?

編者按,本次文章的觀點總結者是:
車品覺:中國信息協會大數據分會副會長
文章內涉及的幾位專家,依次為
Bowen Zhou:IBM Watson實驗室的首席工程師,在統計機器翻譯(Statistical Machine Translation,SMT)領域有深厚積澱;
徐玲(Elizabeth Xu):曾任職Acxiom集團副總裁,是經驗豐富的成熟的管理者;
Aaron Ling:Ancestry公司總工程師(Senior Director of Engineering );
Junlin Hu:Samsung公司的數據總監(director of data mining)。

沒有留言:

張貼留言

MIT黃金創業課:做對24步,系統性打造成功企業【創業】

Step0   起點 Step1   市場區隔 Step2   灘頭堡市場 Step3   終端使用者檔案 Step4   灘頭堡的總市場規模 Step5   代言人 Step6   生命週期使用案例 Step7   高層次的產品規格 Step8   量化價值主張 Step9  ...