Fugu-MT 論文翻訳(概要): Graph-Augmented Topological Internalization with Dual-Stream Classifiers for Medical Report Generation

論文の概要: Graph-Augmented Topological Internalization with Dual-Stream Classifiers for Medical Report Generation

arxiv url: http://arxiv.org/abs/2605.02376v1
Date: Mon, 04 May 2026 09:17:27 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-05 20:33:50.213582
Title: Graph-Augmented Topological Internalization with Dual-Stream Classifiers for Medical Report Generation
Title（参考訳）: デュアルストリーム分類器を用いた医用レポート生成のためのグラフ強化トポロジカル内部化
Authors: Moyu Tang, Chupei Tang, Junxiao Kong, Di Wang, Tianchi Lu,
Abstract要約: トポロジカル内部化を用いたグラフ拡張型デュアルストリーム医療レポート生成法(GDMRG)を提案する。本フレームワークでは,グローバルな疾患の共起を前提としたパラメータ化重み行列を生成するトポロジカル・ナレッジ・インサイナライゼーション・モジュールであるTKIを導入する。 MIMIC-CXRデータセットの実験は、GDMRGが自然言語の流速を維持しながら競争力のある臨床効果CEを達成することを示した。
参考スコア（独自算出の注目度）: 3.3887144970801555
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Automated medical report generation, MRG, holds substantial value for alleviating radiologist workload and enhancing diagnostic efficiency. However, mainstream approaches typically treat diverse chest abnormalities as isolated classification targets. This paradigm often overlooks inherent disease co-occurrences and struggles to translate medical topological structures into explicit data correlations, constraining the model's reasoning capacity on complex or subtle lesions. To address this, we propose a Graph-Augmented Dual-Stream Medical Report Generation with Topological Internalization, GDMRG. Our framework introduces a Topological Knowledge Internalization module, TKI, which leverages a Graph Convolutional Network, GCN, to generate an explicit parameterized weight matrix based on global disease co-occurrence priors. This facilitates efficient topological knowledge injection without relying on external retrieval mechanisms. Building upon this, we construct a dual-stream classification system: the main branch generates discrete diagnostic prompts under topological constraints, while the auxiliary branch employs an asymmetric optimization strategy to dynamically calibrate decision boundaries for highly imbalanced samples. Concurrently, to establish a logical closed loop between diagnosis and visual grounding, we design a diagnostic-driven Diagnosis-Guided Spatial Attention, DGSA, that utilizes high-dimensional clinical semantics to recalibrate the visual encoder, mitigating feature hallucinations. Comprehensive experiments on the MIMIC-CXR dataset demonstrate that GDMRG achieves competitive clinical efficacy, CE, while maintaining natural language fluency. Furthermore, our model exhibits robust zero-shot generalization on the IU X-Ray dataset. In summary, this work presents an integrated and interpretable paradigm for medical report generation.
Abstract（参考訳）: MRG(Automated Medical Report Generation)は、放射線医の作業量を軽減し、診断効率を高めるために重要な価値を持っている。しかし、主流のアプローチは、様々な胸部異常を孤立した分類対象として扱うのが一般的である。このパラダイムは、しばしば固有の疾患の共起を見落とし、医学的トポロジカルな構造を明示的なデータ相関に変換するのに苦労し、複雑または微妙な病変に対するモデルの推論能力を制限する。そこで本稿では, トポロジカル内部化を用いたグラフ拡張型デュアルストリーム医療レポート生成法GDMRGを提案する。筆者らのフレームワークは,グラフ畳み込みネットワーク(GCN)を利用したTKIというトポロジカル・ナレッジ・インサイナライゼーション・モジュールを導入し,グローバル・コンカレンス・コンカレンス・プリミティブ・マトリクスを生成する。これにより、外部検索機構に頼ることなく、効率的なトポロジカル知識注入が容易になる。主枝は位相的制約の下で離散的な診断プロンプトを生成し,補助枝は非対称な最適化戦略を用いて高度に不均衡なサンプルに対する決定境界を動的に校正する。同時に、診断と視覚的接地の間に論理的閉ループを確立するために、高次元の臨床的意味論を用いて視覚的エンコーダを再分類し、特徴幻覚を緩和する診断駆動型診断誘導空間注意(DGSA)を設計する。 MIMIC-CXRデータセットの総合的な実験により、GDMRGは、自然言語の流速を維持しながら、競争力のある臨床効果CEを達成できることが示された。さらに,本モデルでは,IU X線データセット上でのゼロショットのロバストな一般化を示す。要約して,本研究は医療報告生成のための統合的で解釈可能なパラダイムを提示する。

論文の概要: Graph-Augmented Topological Internalization with Dual-Stream Classifiers for Medical Report Generation

関連論文リスト