論文の概要: MultiConAD: A Unified Multilingual Conversational Dataset for Early Alzheimer's Detection
- arxiv url: http://arxiv.org/abs/2502.19208v1
- Date: Wed, 26 Feb 2025 15:12:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-27 14:57:49.768221
- Title: MultiConAD: A Unified Multilingual Conversational Dataset for Early Alzheimer's Detection
- Title(参考訳): MultiConAD:早期アルツハイマー検出のための統合多言語会話データセット
- Authors: Arezo Shakeri, Mina Farmanbar, Krisztian Balog,
- Abstract要約: 我々は16の認知症関連会話データセットを統合することでAD検出のための新しい多言語データセットを提案する。
第2に、MCIを含む細粒度分類を行い、スパーステキストと高密度テキスト表現を用いて様々な分類器を評価する。
第三に、単言語と多言語の設定で実験を行い、ある言語は多言語訓練の恩恵を受ける一方、他の言語は独立してより優れた性能を発揮することを発見した。
- 参考スコア(独自算出の注目度): 12.803369138301163
- License:
- Abstract: Dementia is a progressive cognitive syndrome with Alzheimer's disease (AD) as the leading cause. Conversation-based AD detection offers a cost-effective alternative to clinical methods, as language dysfunction is an early biomarker of AD. However, most prior research has framed AD detection as a binary classification problem, limiting the ability to identify Mild Cognitive Impairment (MCI)-a crucial stage for early intervention. Also, studies primarily rely on single-language datasets, mainly in English, restricting cross-language generalizability. To address this gap, we make three key contributions. First, we introduce a novel, multilingual dataset for AD detection by unifying 16 publicly available dementia-related conversational datasets. This corpus spans English, Spanish, Chinese, and Greek and incorporates both audio and text data derived from a variety of cognitive assessment tasks. Second, we perform finer-grained classification, including MCI, and evaluate various classifiers using sparse and dense text representations. Third, we conduct experiments in monolingual and multilingual settings, finding that some languages benefit from multilingual training while others perform better independently. This study highlights the challenges in multilingual AD detection and enables future research on both language-specific approaches and techniques aimed at improving model generalization and robustness.
- Abstract(参考訳): 認知症は進行性認知症候群であり、アルツハイマー病(AD)が主な原因である。
会話に基づくAD検出は、ADの初期のバイオマーカーである言語機能障害から、臨床方法に代わる費用対効果を提供する。
しかし、多くの先行研究はAD検出を二項分類の問題として捉えており、早期介入のための重要な段階であるミルド認知障害(MCI)を識別する能力を制限する。
また、研究は主に単一言語データセットに依存し、主に英語で、言語間の一般化性を制限する。
このギャップに対処するため、私たちは3つの重要な貢献をしています。
まず,16の認知症関連会話データセットを統合することで,AD検出のための新しい多言語データセットを提案する。
このコーパスは英語、スペイン語、中国語、ギリシャ語にまたがり、様々な認知評価タスクから得られた音声データとテキストデータの両方が組み込まれている。
第2に、MCIを含む細粒度分類を行い、スパーステキストと高密度テキスト表現を用いて様々な分類器を評価する。
第三に、単言語と多言語の設定で実験を行い、ある言語は多言語訓練の恩恵を受ける一方、他の言語は独立して性能を向上する。
本研究は多言語AD検出の課題を強調し,モデル一般化とロバスト性の向上を目的とした言語固有のアプローチと技術の両方について今後の研究を可能にする。
関連論文リスト
- DECT: Harnessing LLM-assisted Fine-Grained Linguistic Knowledge and Label-Switched and Label-Preserved Data Generation for Diagnosis of Alzheimer's Disease [13.38075448636078]
アルツハイマー病(英: Alzheimer's Disease、AD)は、世界中で5000万人が発症する、不可逆的な神経変性疾患である。
言語障害は認知低下の最も初期の兆候の1つであり、AD患者を正常なコントロール個人と区別するために使用することができる。
患者間対話はそのような障害を検出するために用いられるが、曖昧でうるさい、無関係な情報と混同されることが多い。
論文 参考訳(メタデータ) (2025-02-06T04:00:25Z) - Devising a Set of Compact and Explainable Spoken Language Feature for Screening Alzheimer's Disease [52.46922921214341]
アルツハイマー病(AD)は高齢化社会において最も重要な健康問題の一つとなっている。
我々は,大言語モデル(LLM)とTF-IDFモデルの視覚的機能を活用する,説明可能な効果的な機能セットを考案した。
当社の新機能は、自動ADスクリーニングの解釈可能性を高めるステップバイステップで説明し、解釈することができる。
論文 参考訳(メタデータ) (2024-11-28T05:23:22Z) - Language Generation from Brain Recordings [68.97414452707103]
本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。
提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。
本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文 参考訳(メタデータ) (2023-11-16T13:37:21Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Exploring Multimodal Approaches for Alzheimer's Disease Detection Using
Patient Speech Transcript and Audio Data [10.782153332144533]
アルツハイマー病(英語: Alzheimer's disease、AD)は、認知症の一種であり、患者の健康に深刻な影響を及ぼす。
本研究では,DmentiaBank Pittデータベースから患者の音声と転写データを用いたAD検出法について検討した。
論文 参考訳(メタデータ) (2023-07-05T12:40:11Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Cross-lingual Alzheimer's Disease detection based on paralinguistic and
pre-trained features [6.928826160866143]
本稿ではICASSP-SPGC-2023 ADReSS-M Challenge Taskについて述べる。
この課題は、アルツハイマー病の予測のために、どの音響特徴を一般化し、言語間で伝達できるかを検討することである。
我々は、openSmileツールキットとXLSR-53を用いた音響特性を用いてパラ言語的特徴を抽出する。
本手法は分類タスクの69.6%の精度と回帰タスクの4.788の根平均二乗誤差(RMSE)を実現する。
論文 参考訳(メタデータ) (2023-03-14T06:34:18Z) - Semantic Coherence Markers for the Early Diagnosis of the Alzheimer
Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。
我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。
ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文 参考訳(メタデータ) (2023-02-02T11:40:16Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z) - To BERT or Not To BERT: Comparing Speech and Language-based Approaches
for Alzheimer's Disease Detection [17.99855227184379]
自然言語処理と機械学習はアルツハイマー病(AD)を確実に検出するための有望な技術を提供する
最近のADReSSチャレンジデータセットにおいて、AD検出のための2つのアプローチのパフォーマンスを比較し、比較する。
認知障害検出における言語学の重要性を考えると,細調整BERTモデルはAD検出タスクにおいて特徴に基づくアプローチよりも優れていた。
論文 参考訳(メタデータ) (2020-07-26T04:50:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。