Fugu-MT 論文翻訳(概要): Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives

論文の概要: Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives

arxiv url: http://arxiv.org/abs/2501.03727v2
Date: Wed, 18 Jun 2025 14:38:47 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-19 16:34:05.272415
Title: Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives
Title（参考訳）: 視覚刺激物語におけるトピック進化と横断的一貫性の分析による神経認知障害の検出
Authors: Jinchao Li, Yuejiao Wang, Junan Li, Jiawen Kang, Bo Zheng, Simon Wong, Brian Mak, Helene Fung, Jean Woo, Man-Wai Mak, Timothy Kwok, Vincent Mok, Xianmin Gong, Xixin Wu, Xunying Liu, Patrick Wong, Helen Meng,
Abstract要約: 神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。音声と視覚刺激の相互整合性を測定するための2つの新しい動的マクロ構造手法を提案する。 TITANはCU-MARVEL-RABBITコーパスとADReSSコーパスの両方で優れた性能を示した。
参考スコア（独自算出の注目度）: 84.03001845263
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Early detection of neurocognitive disorders (NCDs) is crucial for timely intervention and disease management. Given that language impairments manifest early in NCD progression, visual-stimulated narrative (VSN)-based analysis offers a promising avenue for NCD detection. Current VSN-based NCD detection methods primarily focus on linguistic microstructures (e.g., pauses, lexical diversity), which are potentially linked to bottom-up (stimulus-driven) cognitive processing. While these features illuminate basic language abilities, the higher-order linguistic macrostructures (e.g., thematic or logical development), which may reflect top-down (concept-driven) cognitive abilities, remain underexplored. These patterns are crucial for NCD detection yet challenging to quantify due to their abstract and complex nature. To bridge this gap, we propose two novel dynamic macrostructural approaches: (1) Dynamic Topic Model (DTM) to track topic evolution over time, and (2) Text-Image Temporal Alignment Network (TITAN) to measure cross-modal consistency between speech and visual stimuli. Experimental results validated the efficiency of proposed approaches in NCD detection, with TITAN achieving superior performance both on the CU-MARVEL-RABBIT corpus (F1 = 0.7238) and the ADReSS corpus (F1 = 0.8889). The feature contribution analysis revealed that macrostructural features (e.g., topic variability, topic change rate, and topic consistency) constituted the most significant contributors in the model's decision pathways, outperforming investigated microstructural features. These findings underscore the critical role of macrostructural patterns in understanding cognitive impairment mechanisms in NCDs.
Abstract（参考訳）: 神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。言語障害が早期にNCDの進行に現れることを考えると、VSNに基づく分析はNCD検出に有望な道を提供する。現在のVSNベースのNCD検出法は、主にボトムアップ(刺激駆動)認知処理に結びつく言語的微細構造(例えば、停止、語彙の多様性)に焦点を当てている。これらの特徴は基本的な言語能力に照らしているが、トップダウン(概念駆動)認知能力を反映する高階言語マクロ構造(例えば、主題的または論理的発達)はいまだに未熟である。これらのパターンは、NCDの検出には不可欠であるが、その抽象的で複雑な性質のため、定量化は困難である。このギャップを埋めるために,(1)話題の時間的変化を追跡する動的トピックモデル(DTM)と(2)音声と視覚刺激の相互整合性を測定するテキスト画像時間アライメントネットワーク(TITAN)の2つの新しい動的マクロ構造手法を提案する。 TITANはCU-MARVEL-RABBITコーパス(F1 = 0.7238)とADReSSコーパス(F1 = 0.8889)の両方で優れた性能を発揮する。特徴コントリビューション分析の結果, マクロ構造的特徴(例えば, トピック変動率, トピック変化率, トピック整合性)が, モデル決定経路における最も重要なコントリビュータであり, 調査対象のミクロ構造的特徴よりも優れていた。これらの知見は,NCDにおける認知障害機構の理解におけるマクロ構造パターンの重要性を浮き彫りにした。

関連論文リスト

Uncovering Latent Communication Patterns in Brain Networks via Adaptive Flow Routing [6.266036335881278]
神経通信力学のレンズを通して多モード融合を定式化する。 AFR-Netは、構造的制約(SC)が機能的通信パターン(FC)を引き起こす方法をモデル化する物理インフォームドフレームワークである。実験により、AFR-Netは最先端のベースラインを大きく上回っていることが示された。
論文参考訳（メタデータ） (2026-01-31T06:56:50Z)
Cognitive Foundations for Reasoning and Their Manifestation in LLMs [63.12951576410617]
大規模言語モデル(LLM)は複雑な問題を解くが、単純な変種では失敗し、人間の推論と根本的に異なるメカニズムによって正しい出力を達成することを示唆している。我々は認知科学研究を、推論不変量、メタ認知制御、推論と知識の組織化のための表現、変換操作にまたがる28の認知要素の分類学に合成する。複雑な問題に対して66.7%の性能向上を図り、成功構造を自動的に把握するテストタイム推論ガイダンスを開発した。
論文参考訳（メタデータ） (2025-11-20T18:59:00Z)
Interpretable Neuropsychiatric Diagnosis via Concept-Guided Graph Neural Networks [56.75602443936853]
青少年の5人に1人は、不安、うつ病、行動障害などの精神状態または行動の健康状態と診断されている。従来の研究では、障害予測にグラフニューラルネットワーク(GNN)アプローチを使用していたが、ブラックボックスのままであり、信頼性と臨床翻訳を制限している。本研究では,解釈可能な機能接続の概念を符号化する概念に基づく診断フレームワークを提案する。我々の設計は臨床的に意味のある接続パターンを通じて予測を保証し、解釈可能性と強い予測性能の両方を可能にする。
論文参考訳（メタデータ） (2025-10-02T19:38:46Z)
From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [66.36007274540113]
MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文参考訳（メタデータ） (2025-09-29T18:25:40Z)
Estimating the strength and timing of syntactic structure building in naturalistic reading [4.261343728593896]
句構造がカテゴリー検出に先行し,語彙的影響を支配できることを示す。これらの知見は、理解の予測的「ツリー・スキャフォールディング」を裏付けるものである。
論文参考訳（メタデータ） (2025-09-27T08:56:12Z)
Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder [60.84344168388442]
言語関連機能的磁気共鳴画像(fMRI)は,認知機能低下と早期NCDの検出に有望なアプローチである。香港在住の高齢者97名を対象に,この課題の有効性について検討した。本研究は、加齢に伴う認知低下とNCDの早期発見のための自然言語関連fMRIタスクの可能性を示した。
論文参考訳（メタデータ） (2025-06-10T16:58:47Z)
Unlocking Multimodal Integration in EHRs: A Prompt Learning Framework for Language and Time Series Fusion [27.70300880284899]
大規模言語モデル(LLM)は、視覚言語タスクにおいて顕著な性能を示してきたが、医療分野におけるそれらの応用はいまだ研究されていない。 ProMedTSは、データ型を統一するために、プロンプト誘導学習を利用する、新しい自己教師型マルチモーダルフレームワークである。実世界のデータセットを用いた診断タスクにおけるProMedTSの評価を行い,本手法が常に最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2025-02-19T07:56:48Z)
NeuroXVocal: Detection and Explanation of Alzheimer's Disease through Non-invasive Analysis of Picture-prompted Speech [4.815952991777717]
NeuroXVocalは、音声分析によってアルツハイマー病(AD)の可能性を分類し、説明する新しい二重成分システムである。分類コンポーネント(Neuro)は、音声パターンと音声特徴をキャプチャする音響特徴、音声書き起こしから抽出したテキスト特徴、言語パターンを表す事前計算された埋め込みの3つの異なるデータストリームを処理する。説明可能性コンポーネント(XVocal)は、大規模言語モデルとAD研究文献のドメイン固有の知識ベースを組み合わせた、検索・拡張生成(RAG)アプローチを実装している。
論文参考訳（メタデータ） (2025-02-14T12:09:49Z)
Neuron: Learning Context-Aware Evolving Representations for Zero-Shot Skeleton Action Recognition [64.56321246196859]
本稿では,dUalスケルトン・セマンティック・セマンティック・セマンティック・セマンティック・シンジスティック・フレームワークを提案する。まず、時空間進化型マイクロプロトタイプを構築し、動的コンテキスト認識側情報を統合する。本研究では,空間的圧縮と時間的記憶機構を導入し,空間的時間的マイクロプロトタイプの成長を導く。
論文参考訳（メタデータ） (2024-11-18T05:16:11Z)
Cognitive Networks and Performance Drive fMRI-Based State Classification Using DNN Models [0.0]
我々は、個々の認知状態を分類するために、構造的に異なる2つのDNNモデルと相補的なDNNモデルを用いる。アーキテクチャ上の違いにもかかわらず、両者のモデルが常に予測精度と個人の認知性能との間に堅牢な関係を生んでいることを示す。
論文参考訳（メタデータ） (2024-08-14T15:25:51Z)
An interpretable generative multimodal neuroimaging-genomics framework for decoding Alzheimer's disease [13.213387075528017]
アルツハイマー病(英語: Alzheimer's disease, AD)は、認知機能障害(Mild Cognitive Impairment, MCI)として知られる前ドロマステージを含む認知症である。この研究の目的は、マルチモーダルMRIデータと単一核化物多型に依存する脳構造と機能の構造的・機能的調節を捉えることである。
論文参考訳（メタデータ） (2024-06-19T07:31:47Z)
Interpretable Spatio-Temporal Embedding for Brain Structural-Effective Network with Ordinary Differential Equation [56.34634121544929]
本研究では,まず動的因果モデルを用いて脳効果ネットワークを構築する。次に、STE-ODE(Spatio-Temporal Embedding ODE)と呼ばれる解釈可能なグラフ学習フレームワークを導入する。このフレームワークは、構造的および効果的なネットワーク間の動的相互作用を捉えることを目的とした、特異的に設計されたノード埋め込み層を含んでいる。
論文参考訳（メタデータ） (2024-05-21T20:37:07Z)
DSAM: A Deep Learning Framework for Analyzing Temporal and Spatial Dynamics in Brain Networks [4.041732967881764]
ほとんどのrs-fMRI研究は、関心のある脳領域にまたがる単一の静的機能接続行列を計算している。これらのアプローチは、脳のダイナミクスを単純化し、目の前のゴールを適切に考慮していないリスクがある。本稿では,時系列から直接ゴール固有の機能的接続行列を学習する,解釈可能な新しいディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2024-05-19T23:35:06Z)
SEINE: Structure Encoding and Interaction Network for Nuclei Instance Segmentation [15.769396833096149]
同様に、クロモフォブ核の核内領域と核外領域の視覚的表現は、しばしば低セグメンテーションを引き起こす。現在の手法では核構造の探索が欠如しており、結果として断片化されたインスタンス予測がもたらされる。本稿では,原子核の構造モデリング手法を開発する構造符号化・相互作用ネットワークSEINEを提案する。
論文参考訳（メタデータ） (2024-01-18T07:44:04Z)
Multi-task Collaborative Pre-training and Individual-adaptive-tokens Fine-tuning: A Unified Framework for Brain Representation Learning [3.1453938549636185]
協調的事前学習と個別学習を組み合わせた統合フレームワークを提案する。提案したMCIATはADHD-200データセット上で最先端の診断性能を実現する。
論文参考訳（メタデータ） (2023-06-20T08:38:17Z)
Leveraging Pretrained Representations with Task-related Keywords for Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文参考訳（メタデータ） (2023-03-14T16:03:28Z)
M-SENSE: Modeling Narrative Structure in Short Personal Narratives Using Protagonist's Mental Representations [14.64546899992196]
本研究では,登場人物の心的状態の推測を解析し,物語構造の顕著な要素を自動的に検出するタスクを提案する。本稿では,物語構造の主要な要素,特にクライマックスと解像度のマニュアルアノテーションを含む,短い個人物語のSTORIESデータセットを紹介する。我々のモデルは、クライマックスと解像度を識別するタスクにおいて、大幅な改善を達成できる。
論文参考訳（メタデータ） (2023-02-18T20:48:02Z)
Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering [134.91774666260338]
既存の視覚的質問応答法は、しばしばクロスモーダルなスプリアス相関と過度に単純化されたイベントレベルの推論プロセスに悩まされる。本稿では,イベントレベルの視覚的質問応答の課題に対処するために,モーダルな因果関係推論のためのフレームワークを提案する。
論文参考訳（メタデータ） (2022-07-26T04:25:54Z)
An Empirical Study: Extensive Deep Temporal Point Process [61.14164208094238]
本稿では,非同期イベントシーケンスを時間的プロセスでモデル化することの課題と最近の研究を概観する。本稿では,多種類のイベント間の関係を生かしたGranger因果発見フレームワークを提案する。
論文参考訳（メタデータ） (2021-10-19T10:15:00Z)
Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文参考訳（メタデータ） (2021-09-06T13:10:37Z)
On-the-Fly Attention Modularization for Neural Generation [54.912042110885366]
生成したテキストは反復的であり,汎用的であり,自己矛盾であり,常識を欠いている。本研究は,インダクティブバイアスを推論中に注入する簡易かつ効果的な手法である,オンザフライアテンション・モダナイゼーションを動機とする。
論文参考訳（メタデータ） (2021-01-02T05:16:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。