論文の概要: Foundation Model-based Evaluation of Neuropsychiatric Disorders: A Lifespan-Inclusive, Multi-Modal, and Multi-Lingual Study
- arxiv url: http://arxiv.org/abs/2512.20948v1
- Date: Wed, 24 Dec 2025 05:07:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.682093
- Title: Foundation Model-based Evaluation of Neuropsychiatric Disorders: A Lifespan-Inclusive, Multi-Modal, and Multi-Lingual Study
- Title(参考訳): 基礎モデルによる神経精神疾患の評価 : 生涯包括的・多モード的・多言語的研究
- Authors: Zhongren Dong, Haotian Guo, Weixiang Xu, Huan Zhao, Zixing Zhang,
- Abstract要約: アルツハイマー病(AD)、うつ病、自閉症スペクトラム障害(ASD)などの神経精神疾患は、言語学的および音響的異常によって特徴づけられる。
FEND (Foundation model-based Evaluation of Neuropsychiatric Disorders) は、生涯にわたってAD、うつ病、ASDを検出するための音声とテキストのモダリティを統合した総合的な多モードフレームワークである。
- 参考スコア(独自算出の注目度): 18.4135590766724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neuropsychiatric disorders, such as Alzheimer's disease (AD), depression, and autism spectrum disorder (ASD), are characterized by linguistic and acoustic abnormalities, offering potential biomarkers for early detection. Despite the promise of multi-modal approaches, challenges like multi-lingual generalization and the absence of a unified evaluation framework persist. To address these gaps, we propose FEND (Foundation model-based Evaluation of Neuropsychiatric Disorders), a comprehensive multi-modal framework integrating speech and text modalities for detecting AD, depression, and ASD across the lifespan. Leveraging 13 multi-lingual datasets spanning English, Chinese, Greek, French, and Dutch, we systematically evaluate multi-modal fusion performance. Our results show that multi-modal fusion excels in AD and depression detection but underperforms in ASD due to dataset heterogeneity. We also identify modality imbalance as a prevalent issue, where multi-modal fusion fails to surpass the best mono-modal models. Cross-corpus experiments reveal robust performance in task- and language-consistent scenarios but noticeable degradation in multi-lingual and task-heterogeneous settings. By providing extensive benchmarks and a detailed analysis of performance-influencing factors, FEND advances the field of automated, lifespan-inclusive, and multi-lingual neuropsychiatric disorder assessment. We encourage researchers to adopt the FEND framework for fair comparisons and reproducible research.
- Abstract(参考訳): アルツハイマー病(AD)、うつ病、自閉症スペクトラム障害(ASD)などの神経精神疾患は、早期発見のための潜在的なバイオマーカーを提供する言語学的および音響的異常によって特徴づけられる。
マルチモーダルアプローチの約束にもかかわらず、多言語一般化や統一評価フレームワークの欠如といった課題が続いている。
これらのギャップに対処するために, 生涯にわたってAD, うつ病, ASDを検出するための音声とテキストのモダリティを統合した総合的多モードフレームワークであるFEND(Foundation model-based Evaluation of Neuropsychiatric Disorders)を提案する。
英語,中国語,ギリシャ語,フランス語,オランダ語にまたがる13の多言語データセットを用いて,マルチモーダル融合性能を体系的に評価した。
以上の結果より,多モード核融合はADとうつ病検出において優れるが,データセットの不均一性によりASDでは不十分であることが明らかとなった。
また、モダリティの不均衡は、マルチモーダル融合が最良のモノモーダルモデルを超えないような問題である。
クロスコーパス実験は,多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語
広範囲なベンチマークとパフォーマンスに影響する要因の詳細な分析を提供することで、FENDは自動的、生涯包括的、多言語性神経精神疾患評価の分野を前進させる。
我々は、公正な比較と再現可能な研究のためにFENDフレームワークを採用することを推奨する。
関連論文リスト
- R-GenIMA: Integrating Neuroimaging and Genetics with Interpretable Multimodal AI for Alzheimer's Disease Progression [63.97617759805451]
アルツハイマー病の早期発見には、マクロスケールの神経解剖学的変化とマイクロスケールの遺伝的感受性を統合できるモデルが必要である。
本稿では,新しいROIワイド・ビジョン・トランスフォーマと遺伝的プロンプトを結合した多モード多言語モデルR-GenIMAを紹介する。
R-GenIMAは、通常の認知、主観記憶、軽度認知障害、ADの4方向分類において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-12-22T02:54:10Z) - MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.064286116035134]
我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。
まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。
次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文 参考訳(メタデータ) (2025-10-24T02:11:05Z) - Cross-modal Causal Intervention for Alzheimer's Disease Prediction [13.584994367762398]
アルツハイマー病診断のためのCross-modal Causal Intervention with Mediator (MediAD) という視覚言語因果性に着想を得たフレームワークを提案する。
我々の枠組みは、統一因果介入法により、観測可能・観測不可能な共同創設者の効果を暗黙的に緩和する。
論文 参考訳(メタデータ) (2025-07-18T14:21:24Z) - Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - A Layered Multi-Expert Framework for Long-Context Mental Health Assessments [9.095637530998134]
Stacked Multi-Model Reasoning (SMMR)は、複数のモデルを等価な'専門家'として活用する階層化フレームワークである。
DAIC-WOZうつ病スクリーニングデータセットを用いてSMMRを評価し,48例の精神科診断症例について検討した。
多様な「第2の意見」を活用することで、SMMRは幻覚を緩和し、微妙な臨床的ニュアンスを捉え、高い精神健康評価の信頼性を高める。
論文 参考訳(メタデータ) (2025-01-20T03:22:19Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - The Curse of Multi-Modalities: Evaluating Hallucinations of Large Multimodal Models across Language, Visual, and Audio [118.75449542080746]
本稿では,大規模マルチモーダルモデル(LMM)における幻覚に関する最初の系統的研究について述べる。
本研究は,幻覚に対する2つの重要な要因を明らかにした。
私たちの研究は、モダリティ統合の不均衡やトレーニングデータからのバイアスなど、重要な脆弱性を強調し、モダリティ間のバランスの取れた学習の必要性を強調した。
論文 参考訳(メタデータ) (2024-10-16T17:59:02Z) - Multimodal Audio-based Disease Prediction with Transformer-based Hierarchical Fusion Network [6.175036031779841]
マルチモーダル融合は診断性能の向上に有効であることが証明されている。
汎用マルチモーダルオーディオベースの病気予測のためのトランスフォーマーに基づく階層型融合ネットワークを提案する。
当モデルでは, 新型コロナウイルス, パーキンソン病, 病理疾患の3つの疾患の予測において, 最先端の成績が得られた。
論文 参考訳(メタデータ) (2024-10-11T22:37:52Z) - Cognitive Insights Across Languages: Enhancing Multimodal Interview Analysis [0.6062751776009752]
軽度認知障害と認知スコアを予測できるマルチモーダルモデルを提案する。
提案モデルでは,インタビューで使用した言語を書き起こし,区別する能力を示す。
提案手法では,提案手法から得られた様々な特徴を詳細に検討する。
論文 参考訳(メタデータ) (2024-06-11T17:59:31Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。