論文の概要: Cross-Lingual Multi-Granularity Framework for Interpretable Parkinson's Disease Diagnosis from Speech
- arxiv url: http://arxiv.org/abs/2510.03758v1
- Date: Sat, 04 Oct 2025 09:51:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.233947
- Title: Cross-Lingual Multi-Granularity Framework for Interpretable Parkinson's Disease Diagnosis from Speech
- Title(参考訳): 音声によるパーキンソン病診断のための多言語多言語フレームワーク
- Authors: Ilias Tougui, Mehdi Zakroum, Mounir Ghogho,
- Abstract要約: パーキンソン病(PD)は全世界で1000万人以上の患者に影響を与え、最大89%の患者に発声障害がある。
音素,音節,単語を音声から抽出する自動パイプラインを用いた多言語PD検出のための粒度認識手法を開発した。
音素レベルの分析は93.78%+-2.34%のAUROCと92.17%+-2.43%の精度で優れた性能を達成した。
- 参考スコア(独自算出の注目度): 12.214351085553822
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parkinson's Disease (PD) affects over 10 million people worldwide, with speech impairments in up to 89% of patients. Current speech-based detection systems analyze entire utterances, potentially overlooking the diagnostic value of specific phonetic elements. We developed a granularity-aware approach for multilingual PD detection using an automated pipeline that extracts time-aligned phonemes, syllables, and words from recordings. Using Italian, Spanish, and English datasets, we implemented a bidirectional LSTM with multi-head attention to compare diagnostic performance across the different granularity levels. Phoneme-level analysis achieved superior performance with AUROC of 93.78% +- 2.34% and accuracy of 92.17% +- 2.43%. This demonstrates enhanced diagnostic capability for cross-linguistic PD detection. Importantly, attention analysis revealed that the most informative speech features align with those used in established clinical protocols: sustained vowels (/a/, /e/, /o/, /i/) at phoneme level, diadochokinetic syllables (/ta/, /pa/, /la/, /ka/) at syllable level, and /pataka/ sequences at word level. Source code will be available at https://github.com/jetliqs/clearpd.
- Abstract(参考訳): パーキンソン病(PD)は全世界で1000万人以上の患者に影響を与え、最大89%の患者に発声障害がある。
現在の音声に基づく検出システムは全発話を分析し、特定の音声要素の診断値を見落としている可能性がある。
音素,音節,単語を音声から抽出する自動パイプラインを用いた多言語PD検出のための粒度認識手法を開発した。
イタリア, スペイン語, 英語のデータセットを用いて, 異なる粒度レベルの診断性能を比較するために, 多視点対応の双方向LSTMを実装した。
音素レベルの分析は93.78%+-2.34%のAUROCと92.17%+-2.43%の精度で優れた性能を達成した。
これにより,言語横断型PD検出の診断能力が向上した。
注目分析の結果, 声素レベルにおける持続母音 (/a/, /e/, /o/, /i/) , 音節レベルにおけるダイアドコキネティクス音節 (/ta/, /pa/, /la/, /ka/) , 単語レベルにおける /pataka/ の順に有意な音声特徴が認められた。
ソースコードはhttps://github.com/jetliqs/clearpd.comで入手できる。
関連論文リスト
- NeuroVoz: a Castillian Spanish corpus of parkinsonian speech [34.916222066004465]
この写本は、58人の健康的なコントロールと54人のPDを含む112人のカスティーリャ・スペイン語話者からなるNeuroVoz corpusを提示している。
また、このデータセットは、GRBAS尺度に従って専門家が行う音声品質の主観評価と補完される。
このデータセットはすでにいくつかの研究を支持しており、PDのスクリーニングのベンチマーク精度は89%に達した。
論文 参考訳(メタデータ) (2024-03-04T16:17:39Z) - Towards a Deep Understanding of Multilingual End-to-End Speech
Translation [52.26739715012842]
我々は22言語以上で訓練された多言語エンドツーエンド音声翻訳モデルで学習した表現を解析する。
我々は分析から3つの大きな発見を得た。
論文 参考訳(メタデータ) (2023-10-31T13:50:55Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Parkinson's disease diagnostics using AI and natural language knowledge
transfer [0.0]
PDと診断された症例における生音声の分類のための深層学習手法を提案する。
対象は, PD患者38名, 健常者10名で, 50歳以上であった。
論文 参考訳(メタデータ) (2022-04-26T19:39:29Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Comparative Study of Speech Analysis Methods to Predict Parkinson's
Disease [0.0]
発声障害は、変性する前にこの疾患を検出するために用いられる。
この研究は、PDを予測するための音声特徴と機械学習アプローチを分析する。
全ての音響特性とMFCCを使い、SVMと共に98%の精度で最高の性能を実現した。
論文 参考訳(メタデータ) (2021-11-15T04:29:51Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Detecting Parkinson's Disease From an Online Speech-task [4.968576908394359]
本稿では,世界中のどこでも短時間の音声タスクを記録できるWebベースのフレームワークを構想し,パーキンソン病(PD)のスクリーニングのために記録データを解析する。
対象者は726名(女性262名,女性38%,非女性464名,女性65%,平均年齢61名)であった。
音声データから標準音響特徴(MFCC)、ジッタおよびシマー変種(シマー変種)、および深層学習に基づく特徴を抽出した。
我々のモデルは、制御された実験室で収集されたデータと「野生」でも同様に良好に機能した。
論文 参考訳(メタデータ) (2020-09-02T21:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。