最近、英語の勉強を兼ねてarXiv等で論文をちょっと読むようになりました。
新しい研究について知ることができて面白いです。
今回はコロナ(新型コロナウイルス感染症、COVID-19)についての話題です。
近年流行っているコロナについて、声や咳による音声データを用いて診断を行う取り組みが多くあります。
他にも音に影響を与える呼吸器などに関連する病気ではこの類の研究がなされているようです。
この音声による病気診断には「医師が患者と対面する必要がない」、「スマホ等のマイク搭載機器のみで診断できる」などのメリットがあります。
実現したら、自宅でパパっと病気の診断ができてしまう、すごい便利な技術ですね。
一方の課題は、やはりその診断の精度になります。
いくら簡単に診断できても間違っていては意味がありません。
今回はそのような音声によってコロナの診断を行うための研究を紹介したいと思います。
咳の音によるAIを用いた診断

無症候性(asymptomatic, 患者が症状を自覚できていない)の患者も含めて咳による判断ができるみたいです。
自覚症状がないような微かな咳音の変化を検知できるようです。
測定された咳の音データはメル周波数ケプストラム係数(MFCC)に変換されます。
メル周波数ケプストラム係数はまずポアソンマスクにかけられ、次に3つの並列にされたResNet50にかけられます。
この4つの層は、医学的な意味合いを持ち、それぞれ、「筋肉」「声帯」「肺・呼吸器」「感情」の特性に対応しています。
その後の出力はプールされてReLU活性化関数を用いた全結合層に入力され、その出力をSigmoid関数に入れてコロナの診断を行います。
引用:COVID-19 Artificial Intelligence Diagnosis Using Only Cough Recordings
学習を行った結果、98.5%の精度でコロナの診断を行うことができます。
また、全体としての精度の低下を伴いますが無症候性を100%検出できるように調整もできます。
感想としては、こんなに高い精度で分かるものかと驚きました。
今後は他の病気の診断も行われることが期待されます。
何かしらの病気にかかった時にスマホ等がすぐ教えてくれるようになれば、パンデミックはなくなるかもしれません。
DiCOVA Challenge
DiCOVA Challengeは、音声によるコロナの診断の研究を促すための企画です。
データセットには2つのトラックがあり、1つは咳の音に焦点を当てており、もう1つは息遣い・持続母音の発音・数の数え方の音声が使用されます。
この論文ではデータセットの紹介と、簡単な機械学習による分類を行っています。
それぞれのトラックについて、LR(Logistic regression, ロジスティック回帰)、MLP(Multi-layer perceptron, 多層パーセプトロン)、RF(Random forest, ランダムフォレスト)で分類が行われています。
引用:DiCOVA Challenge: Dataset, task, and baseline system for COVID-19 diagnosis using acoustics
このような企画があって研究は進んでいくのですね。
選ばれた研究は2021/8/31~9/3に開催されるInterspeech2021で発表されます。
良い精度の識別方法が開発されるのが楽しみです。
コメント