論文の概要: Reverse-Speech-Finder: A Neural Network Backtracking Architecture for Generating Alzheimer's Disease Speech Samples and Improving Diagnosis Performance
- arxiv url: http://arxiv.org/abs/2505.17477v1
- Date: Fri, 23 May 2025 04:59:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.827042
- Title: Reverse-Speech-Finder: A Neural Network Backtracking Architecture for Generating Alzheimer's Disease Speech Samples and Improving Diagnosis Performance
- Title(参考訳): Reverse-Speech-Finder:アルツハイマー病音声サンプルの生成と診断性能向上のためのニューラルネットワークバックトラックアーキテクチャ
- Authors: Victor OK Li, Yang Han, Jacqueline CK Lam, Lawrence YL Cheung,
- Abstract要約: 本研究では,アルツハイマー病(AD)の診断を音声解析により強化するニューラルネットワークバックトラックアーキテクチャであるReverse-Speech-Finder(RSF)を紹介する。
RSFは、実際のAD音声サンプルの不足と既存モデルの限定的な解釈可能性の両面に対処し、最も可能性の高いAD固有の音声マーカーを特定し、利用している。
実験の結果、RSFはSHAPやIntegrated Gradientsといった従来の手法よりも優れており、精度は3.5%向上し、F1スコアは3.2%向上した。
- 参考スコア(独自算出の注目度): 14.542819136979045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study introduces Reverse-Speech-Finder (RSF), a groundbreaking neural network backtracking architecture designed to enhance Alzheimer's Disease (AD) diagnosis through speech analysis. Leveraging the power of pre-trained large language models, RSF identifies and utilizes the most probable AD-specific speech markers, addressing both the scarcity of real AD speech samples and the challenge of limited interpretability in existing models. RSF's unique approach consists of three core innovations: Firstly, it exploits the observation that speech markers most probable of predicting AD, defined as the most probable speech-markers (MPMs), must have the highest probability of activating those neurons (in the neural network) with the highest probability of predicting AD, defined as the most probable neurons (MPNs). Secondly, it utilizes a speech token representation at the input layer, allowing backtracking from MPNs to identify the most probable speech-tokens (MPTs) of AD. Lastly, it develops an innovative backtracking method to track backwards from the MPNs to the input layer, identifying the MPTs and the corresponding MPMs, and ingeniously uncovering novel speech markers for AD detection. Experimental results demonstrate RSF's superiority over traditional methods such as SHAP and Integrated Gradients, achieving a 3.5% improvement in accuracy and a 3.2% boost in F1-score. By generating speech data that encapsulates novel markers, RSF not only mitigates the limitations of real data scarcity but also significantly enhances the robustness and accuracy of AD diagnostic models. These findings underscore RSF's potential as a transformative tool in speech-based AD detection, offering new insights into AD-related linguistic deficits and paving the way for more effective non-invasive early intervention strategies.
- Abstract(参考訳): 本研究は,アルツハイマー病(AD)の診断を音声解析により強化するニューラルネットワークバックトラックアーキテクチャであるReverse-Speech-Finder(RSF)を紹介する。
事前訓練された大規模言語モデルのパワーを活用して、RCFは最も可能性の高いAD固有の音声マーカーを特定し、活用し、実際のAD音声サンプルの不足と既存のモデルでの限定的な解釈可能性の課題に対処する。
RSFのユニークなアプローチは3つの中核的な革新で構成されている: まず、最も予測可能なAD(MPMs)として定義される音声マーカーは、最も予測可能なAD(MPNs)として定義される最も高い確率でこれらのニューロン(ニューラルネットワーク)を活性化させなければならない。
第二に、入力層における音声トークン表現を利用して、MPNからのバックトラックにより、ADの最も確率の高い音声トークン(MPT)を識別する。
最後に,MPNから入力層への逆方向の追跡,MPTと対応するMPMの同定,AD検出のための新しい音声マーカーの発見を行う。
実験の結果、RSFはSHAPやIntegrated Gradientsといった従来の手法よりも優れており、精度は3.5%向上し、F1スコアは3.2%向上した。
新たなマーカーをカプセル化する音声データを生成することにより、RCFは実際のデータ不足の限界を緩和するだけでなく、AD診断モデルの堅牢性と精度を大幅に向上させる。
これらの知見は,AD検出におけるRCFのトランスフォーメーションツールとしての可能性を浮き彫りにし,AD関連言語障害に対する新たな洞察を与え,より効果的な非侵襲的早期介入戦略の道を開いた。
関連論文リスト
- DECT: Harnessing LLM-assisted Fine-Grained Linguistic Knowledge and Label-Switched and Label-Preserved Data Generation for Diagnosis of Alzheimer's Disease [13.38075448636078]
アルツハイマー病(英: Alzheimer's Disease、AD)は、世界中で5000万人が発症する、不可逆的な神経変性疾患である。
言語障害は認知低下の最も初期の兆候の1つであり、AD患者を正常なコントロール個人と区別するために使用することができる。
患者間対話はそのような障害を検出するために用いられるが、曖昧でうるさい、無関係な情報と混同されることが多い。
論文 参考訳(メタデータ) (2025-02-06T04:00:25Z) - Linguistic Features Extracted by GPT-4 Improve Alzheimer's Disease Detection based on Spontaneous Speech [0.9642922440822034]
アルツハイマー病(英: Alzheimer's Disease、AD)は、公衆衛生上の問題である。
GPTのような大規模言語モデル(LLM)は、セマンティックテキスト分析のための強力な新しい可能性を可能にしている。
本研究では,GPT-4を用いて,自発性音声の書き起こしから5つの意味的特徴を抽出する。
論文 参考訳(メタデータ) (2024-12-20T10:43:42Z) - Devising a Set of Compact and Explainable Spoken Language Feature for Screening Alzheimer's Disease [52.46922921214341]
アルツハイマー病(AD)は高齢化社会において最も重要な健康問題の一つとなっている。
我々は,大言語モデル(LLM)とTF-IDFモデルの視覚的機能を活用する,説明可能な効果的な機能セットを考案した。
当社の新機能は、自動ADスクリーニングの解釈可能性を高めるステップバイステップで説明し、解釈することができる。
論文 参考訳(メタデータ) (2024-11-28T05:23:22Z) - Profiling Patient Transcript Using Large Language Model Reasoning Augmentation for Alzheimer's Disease Detection [4.961581278723015]
アルツハイマー病(AD)は認知症の主要な原因であり、徐々に音声や言語能力の低下が特徴である。
近年の深層学習は自発音声によるAD自動検出を容易にする。
各発話中のテキストパターンを,患者の言語的特徴をグローバルに把握せずに直接モデル化する。
論文 参考訳(メタデータ) (2024-09-19T07:58:07Z) - HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Conformer Based Elderly Speech Recognition System for Alzheimer's
Disease Detection [62.23830810096617]
アルツハイマー病(AD)の早期診断は、予防ケアがさらなる進行を遅らせるのに不可欠である。
本稿では,DementiaBank Pitt コーパスをベースとした最新のコンバータに基づく音声認識システムの開発について述べる。
論文 参考訳(メタデータ) (2022-06-23T12:50:55Z) - HASA-net: A non-intrusive hearing-aid speech assessment network [52.83357278948373]
本稿では,DNNに基づく聴覚支援音声評価ネットワーク(HASA-Net)を提案する。
我々の知る限り、HASA-Netは、DNNに基づく統合型非侵襲的補聴器モデルを用いて、品質とインテリジェンスの評価を取り入れた最初の研究である。
実験結果から,HASA-Netの予測音声品質と難聴度スコアは,2つのよく知られた難聴度評価指標と高い相関を示した。
論文 参考訳(メタデータ) (2021-11-10T14:10:13Z) - Multi-Modal Detection of Alzheimer's Disease from Speech and Text [3.702631194466718]
本稿では,アルツハイマー病(AD)の診断に音声と対応する文字を同時に利用する深層学習手法を提案する。
提案手法は,Dementiabank Pitt corpus のトレーニングおよび評価において,85.3%のクロスバリデーション精度を実現する。
論文 参考訳(メタデータ) (2020-11-30T21:18:17Z) - To BERT or Not To BERT: Comparing Speech and Language-based Approaches
for Alzheimer's Disease Detection [17.99855227184379]
自然言語処理と機械学習はアルツハイマー病(AD)を確実に検出するための有望な技術を提供する
最近のADReSSチャレンジデータセットにおいて、AD検出のための2つのアプローチのパフォーマンスを比較し、比較する。
認知障害検出における言語学の重要性を考えると,細調整BERTモデルはAD検出タスクにおいて特徴に基づくアプローチよりも優れていた。
論文 参考訳(メタデータ) (2020-07-26T04:50:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。