GTC 2015 :結合平行運算、模仿人類感知的深度學習,正醞釀一波人工智慧革命
今年 GTC 的主題演講活動上, CEO 黃仁勳開場介紹四項活動主題時,都刻意強調今年的主題與深度學習密不可分;而何謂深度學習?相較於傳統的人工智慧,深度學習模仿人類的認知學習方式,透過接收素材產生自主學習能力,進一步使機器能夠透過學習產生感知。
深度學習的理論處源於 90 年代的影像辨識架構,然而直到 2012 年,由於精確性始終卡在七成,故並未成為主流;然而在 2012 年後,結合 CUDA 平行運算後,一舉使停滯將近十年的深度學習影像辨識突破 8 成,更在今年由百度、 微軟與 Google 紛紛將錯誤率減少至 5% 左右,也使深度學習成為人工智慧的顯學。
以影像辨識的深度學習理論來說,首先是給予深度學習系統大量的相關素材,並告知系統這些素材所代表的意義;例如給予大量兔子的照片之後,告訴系統這樣的生物叫做兔子,而系統會將圖片拆分成大量的圖層,並且分析被稱為兔子的物體具有那些特徵,進而認知到甚麼稱為兔子。
說起來很簡單,其實可以回想起小時候的感知辨識學習過程,也是透過不斷接收資訊後才能建立起甚麼樣的東西可以稱為定義中的那樣物體;然而深度學習與人類感知學習不同的地方在於,人類的感知容易受到成見影響,然而機器的深度學習則是完全中立;例如告知小孩辣椒吃了會不舒服,但小孩可能得真的嘗試被辣到後才願意接受現實,不過機器則辨識到辣椒後就會依循系統的認知不去嘗試。
今天活動中也展示一套經過深度學習感知訓練的系統,藉由學習物體以及相關敘述,可以分析照片內的特徵並且做出敘述;在前幾張照片都能正確的敘述照片的主要物體與特色,不過當一些系統中還為接收過的資訊時,系統會依照最相近的資料進行敘述,像是飛越在海上的飛魚照片就被敘述為飛在海上的鳥等等,不過只要給予更多的資料,即有更精確的判斷力。
深度學習不光只用於影像辨識,在醫療方面也具有相當的發展性,例如用於推測藥效、癌細胞的預測等等,以及自動駕駛系統、語音互動系統,都將透過深度學習更為進化。目前包括 Google 、 Yahoo 、 Facebook 以及中國的百度、搜狐等等都已經積極的投入深度學習的技術開發。
當然 NVIDIA 為了推廣深度學習開發,也發表一套針對深度學習的開發系統 DIGITS DEVBOX ,具備多張 TITAN X 以及 Linux 系統,目前包括 Facebook 以及 Flickr 都已經成為先期試用者,建議售價為 15,000 美金,預計五月推出。
你或許會喜歡