論文の概要: FODA-PG for Enhanced Medical Imaging Narrative Generation: Adaptive Differentiation of Normal and Abnormal Attributes
- arxiv url: http://arxiv.org/abs/2409.03947v1
- Date: Fri, 6 Sep 2024 00:04:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-09 17:10:39.994707
- Title: FODA-PG for Enhanced Medical Imaging Narrative Generation: Adaptive Differentiation of Normal and Abnormal Attributes
- Title(参考訳): FODA-PG : 正常属性と異常属性の適応的鑑別
- Authors: Kai Shu, Yuzhuo Jia, Ziyang Zhang, Jiechao Gao,
- Abstract要約: FODA-PGは, 組織-分散適応分割グラフフレームワークである。
FODA-PGは、疾患関連属性を別々に「病原性」と「病原性」のカテゴリーに分けることで、放射線学的所見の詳細な表現を構築している。
この微細なセマンティック知識を強力なトランスフォーマーベースのアーキテクチャに統合することにより、FODA-PGは正確かつ臨床的に一貫性のあるレポートを生成する。
- 参考スコア(独自算出の注目度): 26.912139217120874
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Medical Imaging Narrative generation aims to alleviate the workload of radiologists by producing accurate clinical descriptions directly from radiological images. However, the subtle visual nuances and domain-specific terminology in medical images pose significant challenges compared to generic image captioning tasks. Existing approaches often neglect the vital distinction between normal and abnormal findings, leading to suboptimal performance. In this work, we propose FODA-PG, a novel Fine-grained Organ-Disease Adaptive Partitioning Graph framework that addresses these limitations through domain-adaptive learning. FODA-PG constructs a granular graphical representation of radiological findings by separating disease-related attributes into distinct "disease-specific" and "disease-free" categories based on their clinical significance and location. This adaptive partitioning enables our model to capture the nuanced differences between normal and pathological states, mitigating the impact of data biases. By integrating this fine-grained semantic knowledge into a powerful transformer-based architecture and providing rigorous mathematical justifications for its effectiveness, FODA-PG generates precise and clinically coherent reports with enhanced generalization capabilities. Extensive experiments on the IU-Xray and MIMIC-CXR benchmarks demonstrate the superiority of our approach over state-of-the-art methods, highlighting the importance of domain adaptation in medical report generation.
- Abstract(参考訳): オートマチック・メディカル・イメージング・ナラティブ・ジェネレーション(Automatic Medical Imaging Narrative Generation)は、放射線画像から直接正確な臨床記述を作成することにより、放射線医の作業負荷を軽減することを目的としている。
しかし、医用画像における微妙な視覚的ニュアンスとドメイン固有の用語は、一般的な画像キャプションタスクと比較して大きな課題を生んでいる。
既存のアプローチは、通常と異常な発見の欠如をしばしば無視し、最適以下のパフォーマンスをもたらす。
本稿では,ドメイン適応学習を通じてこれらの制約に対処する,新しい組織-分散適応分割グラフフレームワークFODA-PGを提案する。
FODA-PGは, 疾患関連属性を, 臨床的意義と位置に基づいて, 個別の「病原性」と「病原性」のカテゴリーに分離し, 放射線学的所見のグラフィカルな表現を構築した。
この適応的パーティショニングにより,本モデルは正常状態と病理状態の微妙な相違を捉え,データバイアスの影響を軽減することができる。
この微粒なセマンティック知識を強力なトランスフォーマーベースのアーキテクチャに統合し、その有効性に対する厳密な数学的正当化を提供することで、FODA-PGは、より高度な一般化機能を備えた正確かつ臨床的に一貫性のあるレポートを生成する。
IU-Xray と MIMIC-CXR ベンチマークの大規模な実験により,医療報告生成における領域適応の重要性が示された。
関連論文リスト
- GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising [1.0138723409205497]
GAN(Generative Adversarial Networks)は低線量CT(LDCT)領域における革命的要素として浮上している。
本総説では,GANに基づくLDCT復調技術の急速な進歩を概観する。
論文 参考訳(メタデータ) (2024-11-14T15:26:10Z) - Adaptive Aggregation Weights for Federated Segmentation of Pancreas MRI [5.631060921219683]
フェデレートラーニング(FL)は、機密データを共有することなく、機関間で協調的なモデルトレーニングを可能にする。
フェデレート平均化(FedAvg)のような従来のFLメソッドは、ドメイン間の一般化において困難に直面している。
本稿では適応的なアグリゲーション重みを取り入れた新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-29T20:53:01Z) - DiffSeg: A Segmentation Model for Skin Lesions Based on Diffusion Difference [2.9082809324784082]
拡散差に基づく皮膚病変のセグメンテーションモデルDiffSegを紹介する。
マルチアウトプット能力は医師のアノテーションの振る舞いを模倣し、セグメンテーション結果の一貫性とあいまいさの可視化を容易にする。
我々は,ISIC 2018 ChallengeデータセットにおけるDiffSegの有効性を示す。
論文 参考訳(メタデータ) (2024-04-25T09:57:52Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - VALD-MD: Visual Attribution via Latent Diffusion for Medical Diagnostics [0.0]
医用画像における視覚的属性は、医用画像の診断関連成分を明確にすることを目指している。
本稿では、潜在拡散モデルとドメイン固有大言語モデルを組み合わせた新しい生成的視覚属性手法を提案する。
結果として生じるシステムは、ゼロショット局所化疾患誘導を含む様々な潜在能力を示す。
論文 参考訳(メタデータ) (2024-01-02T19:51:49Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z) - ScoreNet: Learning Non-Uniform Attention and Augmentation for
Transformer-Based Histopathological Image Classification [11.680355561258427]
高解像度画像はデジタル病理の進歩を妨げる。
パッチベースの処理は、しばしば複数のインスタンス学習(MIL)を組み込んで、画像レベルの予測をもたらす局所的なパッチレベルの表現を集約する。
本稿では,組織像分類に適したトランスフォーマーアーキテクチャを提案する。
局所的なきめ細かな注意と粗いグローバルな注意機構を組み合わせることで、高解像度画像の意味的な表現を効率的な計算コストで学習する。
論文 参考訳(メタデータ) (2022-02-15T16:55:09Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Auxiliary Signal-Guided Knowledge Encoder-Decoder for Medical Report
Generation [107.3538598876467]
放射線技師の動作パターンを模倣する補助信号誘導知識デコーダ(ASGK)を提案する。
ASGKは、内的特徴融合と外部医療言語情報を統合して、医療知識の伝達と学習をガイドする。
論文 参考訳(メタデータ) (2020-06-06T01:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。