論文の概要: From Black Box to Biomarker: Sparse Autoencoders for Interpreting Speech Models of Parkinson's Disease
- arxiv url: http://arxiv.org/abs/2507.16836v1
- Date: Wed, 16 Jul 2025 16:22:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.672635
- Title: From Black Box to Biomarker: Sparse Autoencoders for Interpreting Speech Models of Parkinson's Disease
- Title(参考訳): ブラックボックスからバイオマーカー:パーキンソン病の音声モデル解釈のためのスパースオートエンコーダ
- Authors: Peter Plantinga, Jen-Kai Chen, Roozbeh Sattari, Mirco Ravanelli, Denise Klein,
- Abstract要約: パーキンソン病(PD)などの神経疾患に対する費用対効果と非侵襲的バイオマーカーとしての言論
音声に基づくPD検出システムから解釈可能な内部表現を明らかにするために,スパースオートエンコーダ(SAE)を適用した。
我々は,SAEを小さなバイオメディカルデータセットに適用するための新しいマスクベースのアクティベーションを導入する。
- 参考スコア(独自算出の注目度): 9.968776083852813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech holds promise as a cost-effective and non-invasive biomarker for neurological conditions such as Parkinson's disease (PD). While deep learning systems trained on raw audio can find subtle signals not available from hand-crafted features, their black-box nature hinders clinical adoption. To address this, we apply sparse autoencoders (SAEs) to uncover interpretable internal representations from a speech-based PD detection system. We introduce a novel mask-based activation for adapting SAEs to small biomedical datasets, creating sparse disentangled dictionary representations. These dictionary entries are found to have strong associations with characteristic articulatory deficits in PD speech, such as reduced spectral flux and increased spectral flatness in the low-energy regions highlighted by the model attention. We further show that the spectral flux is related to volumetric measurements of the putamen from MRI scans, demonstrating the potential of SAEs to reveal clinically relevant biomarkers for disease monitoring and diagnosis.
- Abstract(参考訳): スピーチは、パーキンソン病(PD)のような神経疾患に対する費用対効果と非侵襲的なバイオマーカーとして約束される。
生のオーディオで訓練されたディープラーニングシステムは、手作りの機能から入手できない微妙な信号を見つけることができるが、ブラックボックスの性質は臨床応用を妨げる。
そこで我々は,音声に基づくPD検出システムから解釈可能な内部表現を明らかにするために,スパースオートエンコーダ(SAE)を適用した。
我々は,SAEを小さなバイオメディカルデータセットに適用するための新しいマスクベースのアクティベーションを導入する。
これらの辞書は,低エネルギー領域におけるスペクトルフラックスの低減やスペクトル平坦性の増大など,PD音声における特徴的調音障害と強い相関関係があることが判明した。
また,このスペクトルフラックスはMRI検査による精液の体積測定と相関し,SAEsが臨床的に関連性のあるバイオマーカーで疾患のモニタリングと診断に有用であることを示す。
関連論文リスト
- Seeing the Trees for the Forest: Rethinking Weakly-Supervised Medical Visual Grounding [50.483761005446]
現在のモデルは、非効率な注意機構ときめ細かいトークン表現の欠如により、テキスト記述と病気領域を関連付けるのに苦労している。
本稿では、VLMの説明可能性マップを用いて、適切な画像特徴を識別する病原体認識プロンプト(DAP)を提案する。
DAPは3つの主要な胸部X線データセットの最先端手法と比較して、視覚的接地精度を20.74%向上させる。
論文 参考訳(メタデータ) (2025-05-21T05:16:45Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - Distinguishing Parkinson's Patients Using Voice-Based Feature Extraction and Classification [0.0]
本研究は、パーキンソン病患者の音声特徴の抽出と分類を通じて、健常者からパーキンソン病を区別することに焦点を当てる。
また,3層ニューラルネットワークアーキテクチャの精度を従来の機械学習アルゴリズムと比較した。
論文 参考訳(メタデータ) (2025-01-24T10:44:16Z) - Graph Neural Networks for Parkinsons Disease Detection [17.861421892442795]
グラフ畳み込みネットワーク(GCN)を用いた新しいPD検出フレームワークを提案する。
音声セグメントをノードとして表現することにより、GCNモデルは、グラフ全体にわたる変形的キューの集約を促進し、セグメント関係を効果的に活用し、ラベルノイズの影響を緩和する。
実験により, PD検出のためのGCNモデルの有効性を実証し, その基盤となるメカニズムについて考察した。
論文 参考訳(メタデータ) (2024-09-12T09:44:13Z) - NeuroSpex: Neuro-Guided Speaker Extraction with Cross-Modal Attention [47.8479647938849]
本稿では,聴取者の脳波応答を唯一の補助的基準キューとして用いた神経誘導型話者抽出モデルであるNeuroSpexを提案する。
我々は,注目情報を捕捉する新しい脳波信号エンコーダを提案し,また,音声特徴表現を強化するためのクロスアテンション(CA)機構を提案する。
論文 参考訳(メタデータ) (2024-09-04T07:33:01Z) - Can Self-Supervised Neural Representations Pre-Trained on Human Speech
distinguish Animal Callers? [23.041173892976325]
自己教師付き学習(SSL)モデルは、入力から埋め込み空間へ重要な情報を抽出するために、その音響領域とは独立して与えられた信号の固有の構造のみを使用する。
本稿では,人間の音声から学習したSSLニューラル表現の相互伝達性について検討し,生体音響信号の解析を行う。
論文 参考訳(メタデータ) (2023-05-23T13:06:14Z) - Toward Knowledge-Driven Speech-Based Models of Depression: Leveraging
Spectrotemporal Variations in Speech Vowels [10.961439164833891]
抑うつに関連する精神運動士の遅滞は、母音生成の有形差と関連付けられている。
本稿では,母音レベルの音声のスペクトル時間情報を統合し,抑うつを識別する知識駆動機械学習(ML)手法について検討する。
論文 参考訳(メタデータ) (2022-10-05T19:57:53Z) - Texture Characterization of Histopathologic Images Using Ecological
Diversity Measures and Discrete Wavelet Transform [82.53597363161228]
本稿では,病理組織像間でテクスチャを特徴付ける手法を提案する。
2つのHIデータセットに有望な精度で、そのような画像の固有特性を定量化することが可能である。
論文 参考訳(メタデータ) (2022-02-27T02:19:09Z) - The Phonetic Footprint of Parkinson's Disease [16.64383793837174]
パーキンソン病(PD)は患者の運動能力に重大な影響を及ぼす。
母音の不安定性、スラリー発音、遅い発声などの特徴パターンは、影響を受けた個人によく見られる。
健常者を対象に訓練した音声認識器を用いて, PDが患者の音声足跡に与える影響について検討した。
論文 参考訳(メタデータ) (2021-12-21T20:44:21Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。