
自建基礎模型HeAR,可聽咳嗽和呼吸聲辨別肺結核風險
另一項醫療AI專案名為HeAR(Health Acoustic Representations )。Google健康總監暨工程部主任Shravya Shetty表示, HeAR是一款經過3億個音訊檔案訓練而成的AI基礎模型,在今年初發表,可根據人體聲音特徵來判斷疾病風險。官方部落格還指出,與其他同類型AI模型相比,HeAR可以用更少的資料量,達到同等或更好的表現,有助於在醫療界的應用發展。
Google也用了1億個咳嗽聲音檔案來訓練HeAR,可用來辨識早期肺結核風險。Shravya Shetty指出,使用者對著手機咳嗽,HeAR也能準確判斷。該模型已開放API來供研究人員使用,Google也與一家印度呼吸道醫療照護公司Swaasa合作,要改善他們的生物聲學AI模型。
Shravya Shetty也說,Google也正與其他機構合作,要來提高HeAR準確率,並發展出更多疾病的辨識能力。
以AI強化聽力輔助工具,要提供更清晰自然的聆聽體驗
另一個Google醫療AI專案則是「澳洲未來聽力倡議 」,該倡議去年展開,由Google與澳洲人工電子耳公司Cochlear、澳洲國家聲學實驗室等機構聯手,要透過AI分辨、分離各種聲源,在嘈雜環境中降低雜音,來打造更貼近使用者需求的助聽裝置。
Cochlear總監Zachary Smith表示,一般聽力輔助器可分為兩種,一是助聽器,可用來放大、增強進入耳朵的聲音,另一種是人工電子耳,針對聽力損失嚴重的患者,透過繞過耳朵受損之處、直接將聲音訊號傳送至聽力神經。這些助聽裝置,延伸出2種AI研究專案,一是利用深度學習來讓傳入耳中的聲音貼近自然,二是用AI簡化雞尾酒派對效應問題(即在吵雜聚會中,集中聽某一人的聲音而忽略背景對話和噪音)。
在第一個專案,團隊先建置2種模型(如下圖),一是聽力受損的AI模型,另一是聽力正常的模型,並讓2種模型接收測試音訊,接著比對它們對測試音訊產生的聽力訊號,再利用訊號差異來訓練機器學習助聽器。這個機器學習助聽器會搭配聽力受損的AI模型,若其產出的聽力訊號與正常聽力AI模型一樣,就代表訓練完成了。團隊希望透過這種方式,來讓助聽器和人工電子兒使用者聽到的聲音更自然,Zachary Smith表示,目前模型已經完成訓練,接下來將展開人體實驗。
至於第二個專案,他們研究發現,透過麥克風方向設定,已能完全強化主要音、去除背景雜音,接下來是要做到,麥克風在任何方向依然能保留主要音、降低其他噪音。