論文の概要: Graph-Augmented Topological Internalization with Dual-Stream Classifiers for Medical Report Generation
- arxiv url: http://arxiv.org/abs/2605.02376v1
- Date: Mon, 04 May 2026 09:17:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.213582
- Title: Graph-Augmented Topological Internalization with Dual-Stream Classifiers for Medical Report Generation
- Title(参考訳): デュアルストリーム分類器を用いた医用レポート生成のためのグラフ強化トポロジカル内部化
- Authors: Moyu Tang, Chupei Tang, Junxiao Kong, Di Wang, Tianchi Lu,
- Abstract要約: トポロジカル内部化を用いたグラフ拡張型デュアルストリーム医療レポート生成法(GDMRG)を提案する。
本フレームワークでは,グローバルな疾患の共起を前提としたパラメータ化重み行列を生成するトポロジカル・ナレッジ・インサイナライゼーション・モジュールであるTKIを導入する。
MIMIC-CXRデータセットの実験は、GDMRGが自然言語の流速を維持しながら競争力のある臨床効果CEを達成することを示した。
- 参考スコア(独自算出の注目度): 3.3887144970801555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated medical report generation, MRG, holds substantial value for alleviating radiologist workload and enhancing diagnostic efficiency. However, mainstream approaches typically treat diverse chest abnormalities as isolated classification targets. This paradigm often overlooks inherent disease co-occurrences and struggles to translate medical topological structures into explicit data correlations, constraining the model's reasoning capacity on complex or subtle lesions. To address this, we propose a Graph-Augmented Dual-Stream Medical Report Generation with Topological Internalization, GDMRG. Our framework introduces a Topological Knowledge Internalization module, TKI, which leverages a Graph Convolutional Network, GCN, to generate an explicit parameterized weight matrix based on global disease co-occurrence priors. This facilitates efficient topological knowledge injection without relying on external retrieval mechanisms. Building upon this, we construct a dual-stream classification system: the main branch generates discrete diagnostic prompts under topological constraints, while the auxiliary branch employs an asymmetric optimization strategy to dynamically calibrate decision boundaries for highly imbalanced samples. Concurrently, to establish a logical closed loop between diagnosis and visual grounding, we design a diagnostic-driven Diagnosis-Guided Spatial Attention, DGSA, that utilizes high-dimensional clinical semantics to recalibrate the visual encoder, mitigating feature hallucinations. Comprehensive experiments on the MIMIC-CXR dataset demonstrate that GDMRG achieves competitive clinical efficacy, CE, while maintaining natural language fluency. Furthermore, our model exhibits robust zero-shot generalization on the IU X-Ray dataset. In summary, this work presents an integrated and interpretable paradigm for medical report generation.
- Abstract(参考訳): MRG(Automated Medical Report Generation)は、放射線医の作業量を軽減し、診断効率を高めるために重要な価値を持っている。
しかし、主流のアプローチは、様々な胸部異常を孤立した分類対象として扱うのが一般的である。
このパラダイムは、しばしば固有の疾患の共起を見落とし、医学的トポロジカルな構造を明示的なデータ相関に変換するのに苦労し、複雑または微妙な病変に対するモデルの推論能力を制限する。
そこで本稿では, トポロジカル内部化を用いたグラフ拡張型デュアルストリーム医療レポート生成法GDMRGを提案する。
筆者らのフレームワークは,グラフ畳み込みネットワーク(GCN)を利用したTKIというトポロジカル・ナレッジ・インサイナライゼーション・モジュールを導入し,グローバル・コンカレンス・コンカレンス・プリミティブ・マトリクスを生成する。
これにより、外部検索機構に頼ることなく、効率的なトポロジカル知識注入が容易になる。
主枝は位相的制約の下で離散的な診断プロンプトを生成し,補助枝は非対称な最適化戦略を用いて高度に不均衡なサンプルに対する決定境界を動的に校正する。
同時に、診断と視覚的接地の間に論理的閉ループを確立するために、高次元の臨床的意味論を用いて視覚的エンコーダを再分類し、特徴幻覚を緩和する診断駆動型診断誘導空間注意(DGSA)を設計する。
MIMIC-CXRデータセットの総合的な実験により、GDMRGは、自然言語の流速を維持しながら、競争力のある臨床効果CEを達成できることが示された。
さらに,本モデルでは,IU X線データセット上でのゼロショットのロバストな一般化を示す。
要約して,本研究は医療報告生成のための統合的で解釈可能なパラダイムを提示する。
関連論文リスト
- Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - ARIADNE: A Perception-Reasoning Synergy Framework for Trustworthy Coronary Angiography Analysis [11.092207850601488]
ARIADNEは2段階のフレームワークを結合し,RLに基づく狭窄検出のための診断的推論を行う。
1,400の臨床血管造影では、ARIADNEは最先端のセンターラインDice 0.838を達成し、幾何学的ベースラインと比較して偽陽性を41%減少させる。
論文 参考訳(メタデータ) (2026-03-19T17:25:19Z) - GAFR-Net: A Graph Attention and Fuzzy-Rule Network for Interpretable Breast Cancer Image Classification [0.0]
病理画像分類のための頑健で解釈可能なグラフ注意とファジィルールネットワークであるGAFRNetを提案する。
GAFR-Netは、複数の倍率および分類タスクにおいて、様々な最先端手法を一貫して上回ることを示す。
これらの結果は,医用医用画像解析における信頼性の高い意思決定支援ツールとして,GAFR-Netの優れた一般化と実用性を検証した。
論文 参考訳(メタデータ) (2026-02-10T01:25:57Z) - Aligning Findings with Diagnosis: A Self-Consistent Reinforcement Learning Framework for Trustworthy Radiology Reporting [37.57009831483529]
MLLM(Multimodal Large Language Models)は放射線学レポート生成に強い可能性を示している。
本フレームワークは, より詳細な発見のための思考ブロックと, 構造化された疾患ラベルに対する回答ブロックという, 生成を2つの異なる構成要素に再構成する。
論文 参考訳(メタデータ) (2026-01-06T14:17:44Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - MIRNet: Integrating Constrained Graph-Based Reasoning with Pre-training for Diagnostic Medical Imaging [67.74482877175797]
MIRNetは、自己教師付き事前学習と制約付きグラフベースの推論を統合する新しいフレームワークである。
TongueAtlas-4Kは,22の診断ラベルを付した4,000枚の画像からなるベンチマークである。
論文 参考訳(メタデータ) (2025-11-13T06:30:41Z) - Structure-aware Hypergraph Transformer for Diagnosis Prediction in Electronic Health Records [7.359896812163171]
グラフニューラルネットワーク(GNN)は、EMH内の医療コード間の相互作用をモデル化する効果を実証している。
本稿では,3つのアイデアに従う構造対応ハイパーグラフトランス (SHGT) フレームワークを提案する。
実世界のEHRデータセットの実験により、提案されたSHGTは診断予測における既存の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-08-28T07:37:45Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。