今年一月底時,Google 閃電併購了 DeepMind 科技公司,合約金額高達 4 億美元(約 120 億台幣),如此大筆的倉促交易,Google 似乎要宣告它不只要做機器人或自動駕駛的車,還要致力於開發人工智慧,Google 真正想要從 DeepMind 中獲得什麼?
本文作者 Luke Dormehl 是英國的新聞記者兼作家,於 BBC 和 Channel4 從事製作紀錄片的相關工作,即將發行 The Formula 這本書,內容是關於演算法和其如何影響我們生活。
首先,DeepMind 是一家怎麼樣的公司呢?
在 2012 年由神經科學家、年輕的天才棋手 Demis Hassabis 和兩個夥伴們成立,就如同他們的網頁中敘述,「我們從機器學習和神經科學系統中結合了最棒的技術,來建立強大而通用的學習演算法」,在各個產業領域都能被廣泛的應用。
什麼是深度學習(Deep learning)?
深度學習是在 AI(人工智慧,Artificial Intelligence)領域中的一個新興話題,是機器學習(machine learning)裡的一個次分類項目,藉由使用神經網絡來增進像是語音識別能力、計算機視覺(computer vision,一門研究如何使機器『看』的科學,用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等的機器視覺,並且再進行圖像處理,使人眼可以進行觀察的動作)以及自然語言處理(natural language processing,NLP。是人工智慧和語言學領域的分支,探討如何處理及應用自然語言)。
在電腦科學領域它很快地變成其中一個最搶手的領域,但是在短短十年內,要如何從一個模糊的學術名詞變成科技界最炙手可熱的開發領域呢?
身為加拿大蒙特利爾大學的電腦科學與作業研究的教授(又稱為運籌學,一門應用數學的學科,利用統計學和數學模型,尋找複雜問題中的最佳或最接近最佳的解答,常用於解決生活中的複雜問題,尤其是改善或優化現有系統的效率)—— Yoshua Bengio 認為,現在深度學習擁有相當高的價值。
在這所大學,擁有世界上規模最大、專門研究深度學習領域的研究員。而為什麼說現在深度學習享有崇高的價值呢?主要原因是目前缺乏研究專家,需要將近五年的時間來訓練一個博士生,而在五年前,沒有很多的博士生願意花心力去研究深度學習,如果以經濟學的角度來解釋的話,就是因為資源稀少,所以彌足珍貴。
在近幾年來,深度學習已經幫助許多領域有進一步的發展,像是物體識別(Object Recognition,在計算機視覺領域裡,是指一張圖像或一組是頻序列中找到所給定的物體)、機器翻譯(machine translation,屬於計算語言學的領域,研究透過電腦程式將一段文在或演說從自然語言翻譯成另一種自然語言)還有語音辨識等等,這些研究領域對於 AI 研究者來說,長久以來都是難以有突破與顯著進展的範疇。
深度學習不等於機器學習,不要搞混了
就如同上述所說,深度學習可以說是機器學習的次分類。要通盤了解什麼是深度學習,第一步就是必須要分辨它和 AI 的其他領域有什麼差別。之前鑽研 AI 是利用很明確的知識形式;基本上來說,就是告訴電腦在已經設定好的程式指令和面向下,如何和周遭的事物互動。
機器學習是 AI 領域其中一項成果,透過監督式學習經驗,電腦裡的資料集中學到或建立了一個模式,並依照此模式推測新的實例,又或是說萃取出更多的知識。一般而言這涉及人工操作,藉由給他成千上百個訓練例子,並互相校正錯誤後,幫助機器學習更完善。
然而在 AI 領域裡,機器學習已經變成了主流,當然問題不可避免的就產生了。一方面,它必須花大量的時間;另一方面,因為倚賴人類的創造力來想出可以讓機器去學習的抽象概念,這並非是真的在測試機器智慧,最重要的關鍵仍是人類的智慧。
「許多應用機器學習的成功案例依賴手動工程的特色,研究員動手輸入手邊任務的相關資料」,身為博士候選人的 George E. Dahl 如是說,目前他正在多倫多大學的機器學習團隊工作。「機器學習和深度學習不同的是,深度學習的研究者會試著要獲得一個可以自行處理的系統,使其實用性、可行性更高」。
不像機器學習,深度學習幾乎是不用監督的。舉例來說,它包括創造大規模的神經網絡,能夠讓電腦學習,在不需要直接人為干預的狀況下,電腦自己「動腦思考」。
電腦利用深度學習演算法學到的東西,是更加抽象的表達概念。Bengio 說,從我們人類腦中我們有各種不同的表達方式,而深度學習就是從這些我們腦中的概念延伸,透過更簡單的方式,來建立低階和高階的抽象概念。藉由以更抽象的方式展現資訊,機器會變得一般化、更加容易。
Google 建立道德委員會的意願讓他買到 DeepMind
Google 的 DeepMind 併購案最特別的發展就是強制設立道德委員會。Google 建立道德委員會的意願讓他買到 DeepMind,而不是 Facebook。過去五十年幾乎每部科幻電影都必須考量到道德問題;在現實世界中,AI 這塊領域相對而言仍缺少具體的法規,除了一般的隱私權和產品責任以外。
Bengio 認為,現在所建立的眾多模型種類,甚至能使用在最複雜的深度學習工具,只能和昆蟲腦中全部的神經元數目相比。非監督學習仍然存在著很大的挑戰,包括計算機使用和數學運算,這解釋了為什麼擔心 AI 發展不順利這件事情,還太早了。
George Dahl 表示同意,「我們對於人腦的運作和瞭解仍太有限,有太多的不了解,目前所了解的可能只是特定平台,和 AI 並沒有關聯」。電腦比起十年前已經便的強大許多,在我們明白 AI 領域研究者的抱負前,但仍然有太多科學需要更進一步的發展。
深度學習,仍然是個很年輕的領域
要求設立 AI 道德委員會和接下來的對談,關於 AI 現今發展談得不多,反而談到更多的是大眾對 AI 的認知程度。
Dahl 說,「在科幻小說、電影中,我們沒有涉及到任何形式的 AI,但這並不代表深度學習不能運用在很許多商業範疇中,而且對於人們而言應是受用無窮的」。
為什麼深度學習會受到科技界的矚目?很大的原因是它是一個非常新的領域,正要開始茁壯成長。
Dahl 說,「電腦科學是一個年輕的學科,深度學習更是其中更加年輕的領域,這不是像數學這樣的科目,你必須要夠專業才能有所進展,但也因此很少人能夠理解你所做的事情。它是一個太年輕的領域,仍有許多可以發展進而實現的、較容易達成的目標,不然就是問題太難而沒辦法解決」。
「能夠鑽研這個領域,真的是一件令人非常興奮的事,姑且不論困難或簡單,它有太多的潛力,能夠影響世界的潛力」。
Source:Techorange
留言列表