論文の概要: Cross-Linguistic Persona-Driven Data Synthesis for Robust Multimodal Cognitive Decline Detection
- arxiv url: http://arxiv.org/abs/2602.07978v1
- Date: Sun, 08 Feb 2026 14:10:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.901431
- Title: Cross-Linguistic Persona-Driven Data Synthesis for Robust Multimodal Cognitive Decline Detection
- Title(参考訳): ロバストなマルチモーダル認知劣化検出のための言語横断的ペルソナ駆動データ合成
- Authors: Rui Feng, Zhiyao Luo, Liuyu Wu, Wei Wang, Yuting Song, Yong Liu, Kok Pin Ng, Jianqing Li, Xingyao Wang,
- Abstract要約: 我々は、制御可能なゼロショットマルチモーダルデータ合成とChain-of-Thought deductionファインチューニングを統合する新しいフレームワークであるSynCogを紹介する。
この生成パラダイムは、様々な言語にまたがる臨床コーパスの迅速でゼロショット展開を可能にする。
ADReSSとADReSSoベンチマークの実験は、限られた臨床データを合成表現型で増強することで、競争力のある診断性能が得られることを示した。
- 参考スコア(独自算出の注目度): 20.599682298329213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech-based digital biomarkers represent a scalable, non-invasive frontier for the early identification of Mild Cognitive Impairment (MCI). However, the development of robust diagnostic models remains impeded by acute clinical data scarcity and a lack of interpretable reasoning. Current solutions frequently struggle with cross-lingual generalization and fail to provide the transparent rationales essential for clinical trust. To address these barriers, we introduce SynCog, a novel framework integrating controllable zero-shot multimodal data synthesis with Chain-of-Thought (CoT) deduction fine-tuning. Specifically, SynCog simulates diverse virtual subjects with varying cognitive profiles to effectively alleviate clinical data scarcity. This generative paradigm enables the rapid, zero-shot expansion of clinical corpora across diverse languages, effectively bypassing data bottlenecks in low-resource settings and bolstering the diagnostic performance of Multimodal Large Language Models (MLLMs). Leveraging this synthesized dataset, we fine-tune a foundational multimodal backbone using a CoT deduction strategy, empowering the model to explicitly articulate diagnostic thought processes rather than relying on black-box predictions. Extensive experiments on the ADReSS and ADReSSo benchmarks demonstrate that augmenting limited clinical data with synthetic phenotypes yields competitive diagnostic performance, achieving Macro-F1 scores of 80.67% and 78.46%, respectively, outperforming current baseline models. Furthermore, evaluation on an independent real-world Mandarin cohort (CIR-E) demonstrates robust cross-linguistic generalization, attaining a Macro-F1 of 48.71%. These findings constitute a critical step toward providing clinically trustworthy and linguistically inclusive cognitive assessment tools for global healthcare.
- Abstract(参考訳): 音声ベースのデジタルバイオマーカーは、ミルド認知障害(MCI)の早期発見のためのスケーラブルで非侵襲的なフロンティアである。
しかし、ロバスト診断モデルの開発は、急性臨床データ不足と解釈可能な推論の欠如によって妨げられている。
現在のソリューションは言語間の一般化に苦しむことが多く、臨床信頼に不可欠な透明な合理性を提供できない。
これらの障壁に対処するために、制御可能なゼロショットマルチモーダルデータ合成とChain-of-Thought (CoT) deduction fine-tuningを統合する新しいフレームワークであるSynCogを紹介する。
具体的には、SynCogは様々な認知プロファイルを持つ多様な仮想被験者をシミュレートし、臨床データの不足を効果的に軽減する。
この生成パラダイムは,低リソース環境におけるデータボトルネックを効果的に回避し,マルチモーダル大言語モデル(MLLM)の診断性能を高めることにより,多言語にわたる臨床コーパスの迅速かつゼロショット展開を可能にする。
この合成データセットを活用することで、CoT推論戦略を用いて基礎的なマルチモーダルバックボーンを微調整し、ブラックボックス予測に頼るのではなく、診断思考プロセスを明確に記述することを可能にする。
ADReSSoベンチマークとADReSSoベンチマークの大規模な実験により、限られた臨床データを合成表現型で増強すると、それぞれ80.67%、78.46%のマクロ-F1スコアを達成し、現在のベースラインモデルを上回った。
さらに、独立した現実世界のマンダリンコホート(CIR-E)の評価は、48.71%のマクロ-F1に達するような頑健な言語間一般化を示す。
これらの知見は、臨床的に信頼でき、言語学的に包括的な認知評価ツールをグローバルヘルスケアに提供するための重要なステップである。
関連論文リスト
- A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - CURENet: Combining Unified Representations for Efficient Chronic Disease Prediction [24.569877750738286]
CURENetは、構造化されていない臨床ノート、検査結果、患者の時系列データを統合するマルチモーダルモデルである。
CURENetは、さまざまな臨床データ間の複雑な相互作用を捉え、慢性疾患のより信頼性の高い予測モデルを作成することができる。
論文 参考訳(メタデータ) (2025-11-14T15:52:22Z) - Few-Label Multimodal Modeling of SNP Variants and ECG Phenotypes Using Large Language Models for Cardiovascular Risk Stratification [21.890853284710776]
心血管性リスク層形成のための遺伝子情報と電気生理学的情報を組み合わせた,数ラベルのマルチモーダル・フレームワークを提案する。
我々は、このタスクを思考の連鎖(CoT)推論問題とみなし、モデルが予測と共に臨床的に関連性のある有理性を生成するよう促す。
実験結果から,マルチモーダル入力の統合,少数ラベル管理,CoT推論により,多様な患者プロファイル間の堅牢性と一般化性が向上することが示唆された。
論文 参考訳(メタデータ) (2025-10-18T15:19:35Z) - Automated and Interpretable Survival Analysis from Multimodal Data [1.1199585259018459]
本稿では,臨床変数とCT画像の統合による生存分析の自動化を目的とした,解釈可能なマルチモーダルAIフレームワークを提案する。
我々のMultiFIXベースのフレームワークは、Grad-CAMを介して解釈される生存関連機能を深層学習で推測する。
頭頸部癌に対するオープンソースのRADCUREデータセットを用いて、MultiFIXは0.838(予測)と0.826(成層化)のCインデックスを達成する
論文 参考訳(メタデータ) (2025-09-25T21:13:39Z) - An Uncertainty-Aware Dynamic Decision Framework for Progressive Multi-Omics Integration in Classification Tasks [6.736267874971369]
我々は、オミクスデータ分類のための不確実性を考慮したマルチビュー動的決定フレームワークを提案する。
ヘテロジニアスなモジュラリティを統合するために、Dempster-Shafer理論に基づく融合戦略を用いる。
3つのデータセットでは、50%以上のケースが、単一のオミクスモダリティを使用して正確に分類された。
論文 参考訳(メタデータ) (2025-06-20T13:44:14Z) - AUTOCT: Automating Interpretable Clinical Trial Prediction with LLM Agents [47.640779069547534]
AutoCTは、大規模言語モデルの推論能力と古典的な機械学習の説明可能性を組み合わせた、新しいフレームワークである。
臨床治験予測タスクにおいて, AutoCT は SOTA 法と同等以上の性能を示した。
論文 参考訳(メタデータ) (2025-06-04T11:50:55Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。