AI領域現在面臨的三大難題

AI領域現在面臨的三大難題

雖然 Google 滿懷信心地宣告,我們正處於「AI 元年」,在語音及圖像識別領域持續有新的突破,但有個語音智慧型助理並不意味著我們更接近創造真正的 AI。這些問題包含:深度學習系統所需要的大量資料、無力創造多工的AI、缺乏對這些系統運作的了解。

 

 

 

你要先擁有資料,才能擁有AI

big data

(圖片來源/iStock)

 

我們都知道 AI 需要利用資料數據來瞭解這個世界,但我們常常忽略有多少的資料是與 AI 相關的。

Neil Lawrence,一位兼任 Amazon AI 團隊及 Sheffield 大學機器學習的教授表示,這些 AI 需要用來理解概念及辨識特徵的訊息來得比人類還要多,它們需要數十萬筆以上的資料,所有你看到有關深度學習有所成功的應用領域,都可以在這些背後看到非常龐大的資料數據。

Lawrence 認為,現在資料數據的角色就像是兩百年前工業革命當中的煤,1712年,一個叫做 Thomas Newcomen 的英國人改良了一款以煤當燃料的蒸汽機原始版本,60 年後,James Watt 才以此為基礎改良成效率更高的蒸汽機。與 Watt 的機器相比,Newcomen 還稱不上多好,既沒效率又高成本,所以只有在擁有豐富煤田的地方才能克服那種種不便。

現在世界上有許多大小企業像 Newcomen 般地操作它們的機器學習模型,那些或許是具有革命性的,但是如果沒有資料數據讓它們運作,誰會知道結果呢?大一點的科技公司,像是 Google、Facebook 以及 Microsoft,就宛如當初的礦工,它們有非常大的資料數據去支援沒什麼效率的機器學習系統,然後再想辦法改善問題,小一點的新創公司則是可能有好的想法,但他們沒有資料數據的話就無法跟進。

還有個更大的問題是,把你所關注領域的資料拿到手其實是很困難的,舉個例子,有個利用 X 光掃描人體之後的結果、辨識出腫瘤資訊的 AI,但這個 AI 背後所能使用的資料數據非常稀少,因為迫使人們生病來採集所需的相關數據是不道德的,而且關於病人個資方面的隱私權也有許多爭議。

就如同 Lawrence 所譬喻的,真正的問題不是在於用什麼方法來尋找、分類數據,而是要使我們所用的 AI 能夠在僅有少量資料數據的情況下依然運作得有效率,就如同蒸汽機的改良,而這樣子的進步可能也需要 60 年。

 

昆蟲才只需要做好一件事,AI必須能夠三頭六臂

irobot

(圖片來源/《I,robot》)

 

第二個有關於深度學習的關鍵問題是:事實上,我們現在的系統都像是很笨的專家。

Google DeepMind 研究科學家 Raia Hadsell 說,一旦 AI 經過訓練,它們能夠以不可思議的效率辨識出動物或者遊玩 Atari (早期出產過許多經典遊戲的公司)的遊戲,但「世界上還沒有一個神經網路、也還沒有方法可以訓練 AI 到能夠辨識物體及圖像、玩複雜的太空遊戲、聽音樂」(神經網路是深度學習系統的基石)。

當 Google DeepMind 去年二月發出聲明說他們建了一個可以通關 49 款 Atari 遊戲的 AI,那確實是個很大的成就,但每次它破完一個遊戲之後,系統就要再被訓練一次去破下一個遊戲,就像Hadsell 指出的,你無法讓它一次就學習所有不同遊戲的破關方法,因為各款遊戲的規則、方法都不一樣,當你換了遊戲就必須重新學習,所以AI會忘記上一款遊戲的規則。

今年六月,Hadsell 發表了一篇論文,用類神經網路的方式,將各自獨立的深度學習系統結合在一起,試著解決無法進行多工任務的難題,這樣的速度比起每次都要打掉重來還要快多了。

progressive neural network

(圖片來源/ DeepMind / Raia Hadsell

這是個滿有希望的作法,最新的應用是在一個機器人手臂上,學習時間從數週縮短到只需要一天,但還是有個明顯的限制,那就是隨著串在一起的系統愈來愈多,遇到模組規模太大以至於難以調校只是時間早晚的問題。

 

AI的思路流程

aithink

(圖片來源/AWDNews)

最後一個挑戰是,AI 如何導出問題的答案? Virginia 理工大學有個 eye-tracking 實驗,研究員給 AI 看一間臥室的圖片,然後問 AI:「什麼東西蓋在窗戶上?」,結果 AI(的鏡頭)並不是看著窗戶,而是先看著地板,然後四處搜索,如果發現了床,AI 就會回答:是窗簾。這答案沒有錯,但嚴格來說算是恰巧矇對的。因為 AI 從以前的圖片資料學習到,如果它身處於臥室,那它就會知道蓋在窗戶上的東西是窗簾,所以 AI 會先判斷自身所處的環境:看到了床 > 瞭解身處臥室 > 窗戶上的東西就是窗簾。但我們一般所認知到的 AI 應該是會直接望向窗戶,看看有什麼東西在窗戶上,再與資料庫進行比對,做出判斷。

倫敦帝國學院的認知機器人學教授 Murray Shanahan,針對這種情況提出了一種解決方式,這是解決方式假設世界是由複雜的符號、代碼所構成,這些符號與代碼交互結合,才會產生各種行動、事件、物體等等,所以反過來說,我們腦袋中出現的想法皆可被簡化為更基本的邏輯。換言之,我們可以創造一個符號、代碼的資料庫,透過合成的方式來產生 AI 的思考。

再用更簡單點的描述就是,Shanahan 想提供一個「起點系統」來讓 AI 可以認識世界,而不是只是靠著灌輸數據來讓 AI 遵循固定的思考模式,他認為這不僅可以解決 AI 思考邏輯的問題,還可以解決 Hadsell 的多工任務問題。

深度學習一直是 AI 領域一個爹不疼、娘不愛、相當冷門的部分,直到研究員將新的技術加進為數不多的資料數據裡面,以及近年來大量運算能力不斷進步,才變得比較好一些。也許不久後,AI 領域就又會有爆炸性的進展了?

 

資料來源:The Verge

 

Tagged with

Comments

X

忘記密碼?

加入會員

重設密碼
請輸入您的信箱,新的密碼將以mail的方式寄給您