論文の概要: A Benchmark for Early-stage Parkinson's Disease Detection from Speech
- arxiv url: http://arxiv.org/abs/2605.14066v1
- Date: Wed, 13 May 2026 19:43:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.482632
- Title: A Benchmark for Early-stage Parkinson's Disease Detection from Speech
- Title(参考訳): 音声による早期パーキンソン病検出のためのベンチマーク
- Authors: Terry Yi Zhong, Cristian Tejedor-Garcia, Khiet P. Truong, Janna Maas, Louis ten Bosch, Bastiaan R. Bloem,
- Abstract要約: 早期パーキンソン病 (EarlyPD) は臨床的には有意であるが, 未発見である。
そこで本研究では,話者独立スプリットを用いた音声に基づく早期PD検出のための最初のベンチマークを提案する。
- 参考スコア(独自算出の注目度): 6.032182703186787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early-stage Parkinson's disease (EarlyPD) detection from speech is clinically meaningful yet underexplored, and published results are hard to compare because studies differ in datasets, languages, tasks, evaluation protocols, and EarlyPD definitions. To address this issue, we propose the first benchmark for speech-based EarlyPD detection, with a speaker-independent split designed for fair and replicable cross-method evaluation on researcher-accessible datasets. The benchmark covers three common speech tasks and evaluates methods under different training-resource settings. We also present multi-dimensional evaluation breakdowns by dataset, aggregation level, gender, and disease stage to support fine-grained comparisons and clinical adoption. Our results provide a replicable reference and actionable insights, encouraging the adoption of this publicly available benchmark to advance robust and clinically meaningful EarlyPD detection from speech.
- Abstract(参考訳): 早期パーキンソン病 (EarlyPD) は臨床的に有意であるが未発見であり, データセット, 言語, タスク, 評価プロトコル, 早期PD定義に違いがあるため, 比較は困難である。
この問題に対処するために,研究者がアクセス可能なデータセットに対する公平かつ再現性の高いクロスメソッド評価のために,話者独立スプリットを設計した,音声による早期PD検出のための最初のベンチマークを提案する。
このベンチマークは3つの一般的な音声タスクをカバーし、異なるトレーニング・リソース設定下での手法の評価を行う。
また, データセット, 集約レベル, 性別, 疾患ステージによる多次元的評価分析を行い, 詳細な比較と臨床応用を支援する。
以上の結果から,本ベンチマークの採用が促進され,音声からの早期PD検出がより堅牢で臨床的に意味のあるものとなることが示唆された。
関連論文リスト
- Something from Nothing: Data Augmentation for Robust Severity Level Estimation of Dysarthric Speech [69.86604856129883]
外科的音声品質評価(DSQA)は臨床診断と包括的音声技術において重要である。
本研究では,未ラベルの変形音声と大規模典型的な音声データセットを併用した3段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-16T23:00:07Z) - Evaluating the Effectiveness of Pre-Trained Audio Embeddings for Classification of Parkinson's Disease Speech Data [0.7673339435080445]
パーキンソン病のバイオマーカーとしての音声障害
ディープアコースティックな特徴はPD分類の可能性を示唆しているが、その効果は話者の違いによってしばしば異なる。
本研究では,PD分類における3つの事前学習オーディオ埋め込みの有効性について検討した。
論文 参考訳(メタデータ) (2025-06-02T09:32:54Z) - Evaluating the Usefulness of Non-Diagnostic Speech Data for Developing Parkinson's Disease Classifiers [5.7624965034085545]
音声に基づくパーキンソン病(PD)の検出は、その自動化、費用対効果、非侵襲性によって注目されている。
本研究は,Turn-Taking データセットを用いて,もともと診断目的で意図されていなかった音声データに基づいて,PD の診断が可能であることを明らかにする。
論文 参考訳(メタデータ) (2025-05-24T14:45:55Z) - Investigating the Effectiveness of Explainability Methods in Parkinson's Detection from Speech [13.700867213652648]
パーキンソン病(PD)の音声障害は早期診断に重要な指標となる。
音声によるPD検出のモデルは高い性能を示したが、その解釈可能性はまだ未検討である。
本研究は,PD特有の音声特徴を特定するためのいくつかの説明可能性手法を体系的に評価する。
論文 参考訳(メタデータ) (2024-11-12T18:43:27Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - A New Benchmark of Aphasia Speech Recognition and Detection Based on
E-Branchformer and Multi-task Learning [29.916793641951507]
本稿では,最新の音声認識技術を用いた失語症音声認識のための新しいベンチマークを提案する。
CTC/Attentionアーキテクチャに基づく2つのマルチタスク学習手法を導入し、両方のタスクを同時に実行する。
当システムでは,中等度失語症患者に対して,最先端の話者レベル検出精度(97.3%)と相対的なWER低下率(1%)を達成している。
論文 参考訳(メタデータ) (2023-05-19T15:10:36Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Ontology-aware Learning and Evaluation for Audio Tagging [56.59107110017436]
平均平均精度(mAP)は、異なる種類の音をそれらの関係を考慮せずに独立したクラスとして扱う。
オントロジー認識平均平均精度(OmAP)は、評価中にAudioSetオントロジー情報を利用することで、mAPの弱点に対処する。
我々は人間の評価を行い、OmAPはmAPよりも人間の知覚と一致していることを示した。
論文 参考訳(メタデータ) (2022-11-22T11:35:14Z) - Predicting Parkinson's Disease with Multimodal Irregularly Collected
Longitudinal Smartphone Data [75.23250968928578]
パーキンソン病は神経疾患であり、高齢者に多い。
伝統的に病気を診断する方法は、一連の活動テストの品質に関する個人的主観的臨床評価に依存している。
そこで本研究では,スマートフォンが収集した生の行動データを用いて,パーキンソン病を予測するための時系列に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-09-25T01:50:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。