論文の概要: Does Language Matter for Early Detection of Parkinson's Disease from Speech?
- arxiv url: http://arxiv.org/abs/2507.16832v1
- Date: Mon, 14 Jul 2025 19:23:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.666842
- Title: Does Language Matter for Early Detection of Parkinson's Disease from Speech?
- Title(参考訳): パーキンソン病の早期発見には言語が重要であるか?
- Authors: Peter Plantinga, Briac Cordelle, Dominique Louër, Mirco Ravanelli, Denise Klein,
- Abstract要約: 音声サンプルをバイオマーカーとして用いることは、パーキンソン病(PD)の進行を検知し、監視するための有望な道である
PD検出における言語の役割を評価するため,様々なデータ型と事前学習対象を持つ事前学習モデルの検証を行った。
- 参考スコア(独自算出の注目度): 9.968776083852813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using speech samples as a biomarker is a promising avenue for detecting and monitoring the progression of Parkinson's disease (PD), but there is considerable disagreement in the literature about how best to collect and analyze such data. Early research in detecting PD from speech used a sustained vowel phonation (SVP) task, while some recent research has explored recordings of more cognitively demanding tasks. To assess the role of language in PD detection, we tested pretrained models with varying data types and pretraining objectives and found that (1) text-only models match the performance of vocal-feature models, (2) multilingual Whisper outperforms self-supervised models whereas monolingual Whisper does worse, and (3) AudioSet pretraining improves performance on SVP but not spontaneous speech. These findings together highlight the critical role of language for the early detection of Parkinson's disease.
- Abstract(参考訳): 音声サンプルをバイオマーカーとして用いることは、パーキンソン病(PD)の進行を検知し、監視する上で有望な道である。
音声からPDを検出する初期の研究は、持続母音発声(SVP)タスクを使用していたが、近年ではより認知的に要求されるタスクの記録を調査している。
PD検出における言語の役割を評価するため,(1)音声特徴モデルの性能とテキストのみのモデルが一致し,(2)単言語Whisperが悪化するのに対して,(2)単言語Whisperは自己教師モデルより優れ,(3)AudioSetの事前訓練はSVPの性能を改善するが,自然発話ではない。
これらの知見は、パーキンソン病の早期発見における言語の役割を強調している。
関連論文リスト
- Evaluating the Effectiveness of Pre-Trained Audio Embeddings for Classification of Parkinson's Disease Speech Data [0.7673339435080445]
パーキンソン病のバイオマーカーとしての音声障害
ディープアコースティックな特徴はPD分類の可能性を示唆しているが、その効果は話者の違いによってしばしば異なる。
本研究では,PD分類における3つの事前学習オーディオ埋め込みの有効性について検討した。
論文 参考訳(メタデータ) (2025-06-02T09:32:54Z) - Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。
テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文 参考訳(メタデータ) (2025-05-26T07:21:20Z) - Language-Agnostic Analysis of Speech Depression Detection [2.5764071253486636]
本研究は、英語とマラヤラムの2言語間での自動抑うつ検出を解析する。
CNNモデルは、両言語に焦点をあてて、抑うつに関連する音響的特徴を特定するために訓練される。
その結果,言語に依存しない抑うつ検出システムの開発に寄与する可能性が示唆された。
論文 参考訳(メタデータ) (2024-09-23T07:35:56Z) - Self-supervised Speech Models for Word-Level Stuttered Speech Detection [66.46810024006712]
自己教師付き音声モデルを利用した単語レベルの発声音声検出モデルを提案する。
本評価は, 単語レベルの発声検出において, 従来の手法を超越していることを示す。
論文 参考訳(メタデータ) (2024-09-16T20:18:20Z) - NeuroVoz: a Castillian Spanish corpus of parkinsonian speech [34.916222066004465]
この写本は、58人の健康的なコントロールと54人のPDを含む112人のカスティーリャ・スペイン語話者からなるNeuroVoz corpusを提示している。
また、このデータセットは、GRBAS尺度に従って専門家が行う音声品質の主観評価と補完される。
このデータセットはすでにいくつかの研究を支持しており、PDのスクリーニングのベンチマーク精度は89%に達した。
論文 参考訳(メタデータ) (2024-03-04T16:17:39Z) - Learning Cross-lingual Visual Speech Representations [108.68531445641769]
言語横断的な自己監督型視覚表現学習は、ここ数年、研究トピックとして成長している。
我々は最近提案したRAVEn(Raw Audio-Visual Speechs)フレームワークを用いて,未ラベルデータを用いた音声-視覚モデルの事前学習を行う。
1)データ量が多いマルチ言語モデルはモノリンガルモデルよりも優れているが、データの量を維持すると、モノリンガルモデルの性能が向上する傾向にある。
論文 参考訳(メタデータ) (2023-03-14T17:05:08Z) - M-SpeechCLIP: Leveraging Large-Scale, Pre-Trained Models for
Multilingual Speech to Image Retrieval [56.49878599920353]
本研究は,多言語画像音声検索におけるCLIPとHuBERTの大規模,英語のみの事前学習モデル(CLIPとHuBERT)の利用について検討する。
非英語画像音声検索では、各言語毎に個別のモデルを訓練する場合と、3言語すべてで音声を処理する1つのモデルの両方において、最先端のパフォーマンスを幅広いマージンで上回ります。
論文 参考訳(メタデータ) (2022-11-02T14:54:45Z) - Joint Pre-Training with Speech and Bilingual Text for Direct Speech to
Speech Translation [94.80029087828888]
直接音声音声翻訳 (S2ST) は, カスケードされたS2STと比較して, 優れた研究課題である。
直接S2STは、ソース言語の音声からターゲット言語の音声へのコーパスが非常に稀であるため、データ不足の問題に悩まされる。
本稿では,音声から音声への直接翻訳タスクのための音声とバイリンガルのテキストデータとを事前学習したSpeech2Sモデルを提案する。
論文 参考訳(メタデータ) (2022-10-31T02:55:51Z) - The Phonetic Footprint of Parkinson's Disease [16.64383793837174]
パーキンソン病(PD)は患者の運動能力に重大な影響を及ぼす。
母音の不安定性、スラリー発音、遅い発声などの特徴パターンは、影響を受けた個人によく見られる。
健常者を対象に訓練した音声認識器を用いて, PDが患者の音声足跡に与える影響について検討した。
論文 参考訳(メタデータ) (2021-12-21T20:44:21Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z) - Parkinsonian Chinese Speech Analysis towards Automatic Classification of
Parkinson's Disease [31.431256876809343]
パーキンソン病(PD)の早期に発する発声障害
中国語の音声コーパスを新たに構築し,PD患者の分類について検討した。
我々の分類精度は最先端の研究をはるかに上回った。
論文 参考訳(メタデータ) (2021-05-31T04:51:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。