論文の概要: Automatic Prediction of Amyotrophic Lateral Sclerosis Progression using Longitudinal Speech Transformer
- arxiv url: http://arxiv.org/abs/2406.18625v1
- Date: Wed, 26 Jun 2024 13:28:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-28 18:17:19.636504
- Title: Automatic Prediction of Amyotrophic Lateral Sclerosis Progression using Longitudinal Speech Transformer
- Title(参考訳): 縦型音声変換器を用いた筋萎縮性側索硬化進展の自動予測
- Authors: Liming Wang, Yuan Gong, Nauman Dawalatabad, Marco Vilela, Katerina Placek, Brian Tracey, Yishu Gong, Alan Premasiri, Fernando Vieira, James Glass,
- Abstract要約: ニューラルネットワークを用いたALS病進行自動予測器であるALS長手音声変換器(ALST)を提案する。
録音における高品質な事前訓練音声特徴と長手情報を活用することで、最良のモデルが91.0%のAUCを達成できる。
ALSTはALS進行の細粒度で解釈可能な予測が可能で、特に稀な症例と重篤な症例の区別が可能である。
- 参考スコア(独自算出の注目度): 56.17737749551133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic prediction of amyotrophic lateral sclerosis (ALS) disease progression provides a more efficient and objective alternative than manual approaches. We propose ALS longitudinal speech transformer (ALST), a neural network-based automatic predictor of ALS disease progression from longitudinal speech recordings of ALS patients. By taking advantage of high-quality pretrained speech features and longitudinal information in the recordings, our best model achieves 91.0\% AUC, improving upon the previous best model by 5.6\% relative on the ALS TDI dataset. Careful analysis reveals that ALST is capable of fine-grained and interpretable predictions of ALS progression, especially for distinguishing between rarer and more severe cases. Code is publicly available.
- Abstract(参考訳): 筋萎縮性側索硬化症(ALS)の進行を自動予測することは、手動によるアプローチよりも効率的で客観的な代替手段となる。
本稿では,ALS患者の経時的音声記録からALS病の進行を予測するニューラルネットワークを用いたALS長手音声変換器を提案する。
ALS TDIデータセットでは, 高品質な事前訓練音声特徴と長手情報を利用して, 91.0\% AUCを達成し, 従来の最善モデルを5.6\%改善した。
注意深い分析によると、ALSTはALS進行の細粒度で解釈可能な予測が可能であり、特に稀な症例と重篤な症例の区別が可能である。
コードは公開されている。
関連論文リスト
- Towards Interpretable End-Stage Renal Disease (ESRD) Prediction: Utilizing Administrative Claims Data with Explainable AI Techniques [6.417777780911223]
本研究は,慢性腎臓病(CKD)から末期腎疾患(ESRD)への進行を予測するために,高度な機械学習とディープラーニング技術を組み合わせた管理クレームデータを活用する可能性を検討する。
我々は、ランダムフォレストやXGBoostといった従来の機械学習手法とLong Short-Term Memory(LSTM)ネットワークのようなディープラーニングアプローチを用いて、大手医療保険会社が提供した包括的10年間のデータセットを分析し、複数の観測窓の予測モデルを開発する。
以上の結果から,LSTMモデル,特に24ヶ月の観測窓を用いた場合,ESRD進行予測において優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-18T16:03:57Z) - Normative Diffusion Autoencoders: Application to Amyotrophic Lateral Sclerosis [1.7397451877951422]
ノルメティヴモデルは、大きな健康コホートを活用することで、統計力を増加させる解を示す。
我々は、規範拡散オートエンコーダフレームワークを導入することにより、生成的および規範的モデリングの利点を組み合わせる。
提案手法はALSの予測における生成的および非生成的規範的モデリングベンチマークよりも優れている。
論文 参考訳(メタデータ) (2024-07-19T10:39:24Z) - Self-supervised ASR Models and Features For Dysarthric and Elderly Speech Recognition [71.87998918300806]
本稿では,TDNNとConformer ASRシステムにSSLプリトレーニングモデルとその機能を統合するアプローチについて検討する。
ドメイン適応型HuBERT、wav2vec2-conformer、マルチ言語型XLSRモデルを統合することで構築されたTDNNシステムは、スタンドアロンの微調整型SSL事前訓練モデルより一貫して優れている。
DementiaBank Pitt の高齢者音声認識出力を用いて,アルツハイマー病の検出精度の向上も行った。
論文 参考訳(メタデータ) (2024-07-03T08:33:39Z) - It's Never Too Late: Fusing Acoustic Information into Large Language
Models for Automatic Speech Recognition [70.77292069313154]
大規模言語モデル(LLM)は、自動音声認識(ASR)出力の上の生成誤り訂正(GER)に成功することができる。
本研究では,不確実性認識ダイナミックフュージョン (UADF) と呼ばれる新しい遅延融合解によって予測された転写を生成する前に,音響情報を注入することにより,そのような制限を克服することを目的とする。
論文 参考訳(メタデータ) (2024-02-08T07:21:45Z) - Sequential Model for Predicting Patient Adherence in Subcutaneous Immunotherapy for Allergic Rhinitis [16.386676205583697]
皮膚下免疫療法はアレルギー性鼻炎(AR)の長期因果治療である
本研究では、新しい機械学習モデルを活用し、AR患者の非一貫性のリスクを正確に予測することを目的とする。
論文 参考訳(メタデータ) (2024-01-21T09:55:47Z) - Acoustic-to-articulatory inversion for dysarthric speech: Are
pre-trained self-supervised representations favorable? [3.43759997215733]
音響-調音インバージョン(AAI)は、音響から調音空間へのマッピングを伴う。
本研究では,事前に訓練された自己教師付き学習(SSL)モデルの表現を用いて,変形性音声に対するAAIを実行する。
論文 参考訳(メタデータ) (2023-09-03T07:44:38Z) - Hyper-parameter Adaptation of Conformer ASR Systems for Elderly and
Dysarthric Speech Recognition [64.9816313630768]
ファインチューニングは、多くの非高齢および健康な音声事前訓練モデルを利用するためにしばしば用いられる。
本稿では,Librispeech corpus 上で事前学習した Conformer ASR システムのハイパーパラメータ適応について検討する。
論文 参考訳(メタデータ) (2023-06-27T07:49:35Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Classification of ALS patients based on acoustic analysis of sustained
vowel phonations [0.7106986689736825]
Amyotrophic lateral sclerosis (ALS)は急速に進行する経過を用いる不治の神経学的障害です。
ALSの初期の症状は、摂食と発話が困難である。
本研究では,健常者とALS患者を分離する自動システムに対する音声評価手法を提案する。
論文 参考訳(メタデータ) (2020-12-14T08:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。