睡眠呼吸暫停是一種在睡眠期間人的呼吸中斷時發(fā)生的疾病,估計影響了大約2200萬美國人。麻煩的是,大部分病例--80% - 未被診斷,如果不及時治療,睡眠呼吸暫停會增加患冠狀動脈疾病,心臟病,心力衰竭和中風的風險。
一個研究領域 - 自動打鼾聲音分類,或ASSC--旨在開發(fā)一種基于打鼾聲音的睡眠呼吸暫停診斷方法(睡眠呼吸暫停的特點是減少或完全停止氣流的重復發(fā)作)。但是,盡管近年來取得了進展,但仍然缺乏可以訓練ASSC系統(tǒng)的標記數據。
這就是為什么倫敦帝國理工學院,奧格斯堡大學和慕尼黑技術大學的研究人員在一篇新論文(“ Snore-GANs:用合成數據改進自動打鼾聲音分類 ”)中尋求開發(fā)創(chuàng)造合成的生成對抗網絡(GAN)的原因。數據填補實際數據的空白。(對于沒有經驗的人來說,GAN是由生成樣本和鑒別器的生成器組成的兩部分神經網絡,試圖區(qū)分生成的樣本和現實樣本。)然后使用增強數據集來訓練ASSC。
“在進行數據增強時,我們聚合來自所有[GAN]的數據,并從池中隨機選擇進一步合并到原始訓練集中的數據。通過這樣做,預計將擴大來自單獨[GAN]的增強數據的多樣性,“該論文的作者解釋說。
為了驗證他們的方法,他們使用了一個公開的數據集 - 慕尼黑 - 帕薩鼾聲音庫(MPSSC) - 在打鼾時對上呼吸道內的振動位置進行分類,從德國三個醫(yī)療中心現有的檢查記錄開始2006年至2015年期間的臨床檢查。根據隨附視頻記錄的結果,選擇的打鼾事件由醫(yī)療耳鼻喉專家分類,注釋的樣本分為獨立于受試者的培訓,開發(fā)和測試集。
那個方法怎么樣呢?該論文的作者報告說,他們成功地生成了與原始數據共享分布的數據,從而導致培訓數據量的增加,而無需人工注釋。此外,他們說,合成和原始數據的結合改善了分類器的性能。
“未來,我們將不斷收集來自不同醫(yī)院和患者的更多鼾聲數據,以增加數據量和多樣性,我們將重新評估所提出的方法,”研究人員說。“此外,我們將在以下工作中進一步提出和評估更先進的......系統(tǒng),以改進聲學序列生成模型。”