[科技新報]臥室研究兩年半得首獎,美高中女生今年畢業當Google科學大賽評審
美國CBS晚間新聞日前報導了一名叫做Brittany Wenger的高中畢業生,將就讀杜克大學。她很了不起嗎?你聽聽看:這個美少女在國一時就寫了電腦程式去模擬人類在踢足球時的大腦決策過程;她高中三年開發一套人工神經網路針對乳房硬塊是良性或惡性進行檢測,準確率高達97.4%,不僅成為2012年Google Science Fair首獎得主,2013年九月還將與諾貝爾獎得主、權威科學雜誌編輯、太空人、探險家等各領域專家從15組入圍者中共同評選出新一屆的優勝團隊。
換句話說,我們之前報導過的「15歲小女孩發明手電筒,只靠體溫就能亮」、「好友母親驟逝,17歲少女開發黑色素瘤早期診斷工具,準確率80%」、「華裔高中生跨領域篩出可能的抗流感化合物,阻斷病毒蛋白質合成」等今年Google Science Fair入圍者,將是在Brittany Wenger等人手中評選出最後的優勝者。Google Science Fair展現出的年輕活力真是令人感到熱血沸騰,而Brittany Wenger的 「全球神經網路雲端服務乳癌偵測功能」(The Global Neural Network Cloud Service for Breast Cancer)可不是什麼三腳貓功夫,對於乳癌早期檢測,尤其是對於惡性腫塊99.1%的高敏感度,讓因為「偽陰性」(註1)誤診造成的遺憾有了補救的途徑。
體會人生痛苦,熱情學習尋找癌症療法
Wenger說自己是個從小就愛問「為什麼」的人,問問題讓她進入科學的領域,雖然她找到了答案,但問的問題更多了。表姐罹患癌症讓她體驗到了這種疾病帶來的痛苦,在喬治城兒童癌症病房親身感受到的煩悶煎熬也不好受,因此,協助找出癌症的療法是她的目標之一,她決心盡可能學習資訊科學與醫學兩個領域的知識,在高中時期她就已經修完學校提供的相關學程,包括從原有的C#語言跨入Java的領域,未來進了大學她會想主修電腦,兼修醫學院課程。
Wenger表示,多少女人發現乳房有硬塊時,不會想立刻又準確地知道它是良性還是惡性?人工神經網路有沒有辦法更精確地判斷透過細針穿刺細胞(Fine Needle Aspiration, FNA)採集來的樣本?更重要的是,神經網路能否降低「偽陰性」診斷的錯誤?最後,這套檢測工具能否透過雲端給全世界使用?
▲良性(上圖)與惡性(下圖)
具學習能力的神經網路,準確率達97.4%
使用人工神經網路與雲端技術協助進行醫療診斷,可以幫助醫師面對一些用人工方法來說過於複雜的過程,做出高準確性與可信賴的檢測結果,效率也能提升。透過FNA得到的資料,究竟該如何判定乳房硬塊是良性的或惡性的?Wenger的研究便是透過設計一套人工神經網路,試圖找到最佳的檢測結果。
她的研究用樣本來自美國威斯康辛大學自1990年代初便開始收集的資料,首先採用三個既有的商用神經網路做為控制組,從樣本的腫瘤厚度、單一上皮細胞大小、原子核裸露程度、有絲分裂程度等共九種指標進行分析。至於她自己設計的神經網路則特別著重於避免對惡性腫塊的「偽陰性」診斷,以及針對商用網路未有定論樣本的進一步分析。此外,為了接納更多樣本以改進網路的功能,Wenger把這套網路掛在Google應用服務引擎下,也歡迎大家提供更多FNA的資料。
總共四套神經網路各針對680個樣本進行6800次檢測訓練工作,而Wenger設計的神經網路預測成功率為97.4%,對惡性腫塊的靈敏度達到99.1%,比商用神經網路要高出5%。她表示這套神經網路或許已經可以診斷真實的案例,但還是需要來自全球各地的重覆確認,而且實驗證實愈多樣本訓練這套網路,愈能提高它的準確率,因此可以進行盲樣測試(註2)以進一步提高預測成功率。
Wenger FNA AccuracyByTrainingSampleSize
▲樣本數達到300後,準確率便開始緩步上升。
男人在車庫,女人在臥室
「我在臥室做了兩年半的研究,然後把它拿去Google Science Fair,最後得了首獎,這實在是太瘋狂了。」她因此獲得一趟搭乘「國家地理奮進號」前往加拉巴哥群島的探險之旅,那裡是達爾文進化論的研究發源地;可選擇參觀歐洲核子研究組織(CERN)、Google或樂高(都是比賽的贊助者);個人專屬的樂高獎盃及樂高機器人,以及5萬美元的獎學金,連她就讀的高中也雞犬升天,獲得「科學人」雜誌數位版一年份存取權限與1萬元獎勵資金。
得獎後的Wenger,獲邀前往TEDxWomen、TEDxAtlanta、Tech Talks 進行演講,參加 Google Trailblazer,參訪CERN,還獲得新的研究數據。
「嗯,當然沒有偏見的意思,但我想我們都有潛能,我是說,我知道大人常常會抱怨我們,但我們這一個世代能生活在一個充滿資訊的社會真的很幸運,我們可以學到任何我們想學的事物。」「想到有朝一日我的研究能真的能幫助到真實的人們,實在太令人感到興奮,也給了我一大堆希望。」
是的,別忘了透過更多樣本的訓練過程,97.4%與99.1%兩個嚇人的準確率還有機會更加趨近完美。目前她將研究範圍擴展到處理白血病病患的基因剖析,今年秋天當Wenger進入杜克大學後,還會綻放出多麼燦爛的花朵,且讓我們拭目以待。
(Opening Photo Credit: CBS)
註釋
1.false negative,表示在應該有病的情形下檢測卻顯示沒病,與之相對的就是偽陽性(false positive),但前者危害的程度比後者只是虛驚一場要嚴重得多。
2.盲樣(blind sample)是拿已經知道結果的樣本給不知道結果的研究人員測試,藉此確認該研究人員或研究方法的準確性。
相關資料
Young innovators: Meet the brains behind an artificial brain
Global Neural Network Cloud Service for Breast Cancer
應用高頻項目集探勘技術在 DNA 晶片基因表現分析之研究(I)研究成果報告(精簡版)
↓↓↓↓↓↓加入癮科技粉絲團,有更多歡樂有趣的科技新聞↓↓↓↓↓↓