Fugu-MT 論文翻訳(概要): FODA-PG for Enhanced Medical Imaging Narrative Generation: Adaptive Differentiation of Normal and Abnormal Attributes

論文の概要: FODA-PG for Enhanced Medical Imaging Narrative Generation: Adaptive Differentiation of Normal and Abnormal Attributes

arxiv url: http://arxiv.org/abs/2409.03947v1
Date: Fri, 6 Sep 2024 00:04:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-09 17:10:39.994707
Title: FODA-PG for Enhanced Medical Imaging Narrative Generation: Adaptive Differentiation of Normal and Abnormal Attributes
Title（参考訳）: FODA-PG : 正常属性と異常属性の適応的鑑別
Authors: Kai Shu, Yuzhuo Jia, Ziyang Zhang, Jiechao Gao,
Abstract要約: FODA-PGは, 組織-分散適応分割グラフフレームワークである。 FODA-PGは、疾患関連属性を別々に「病原性」と「病原性」のカテゴリーに分けることで、放射線学的所見の詳細な表現を構築している。この微細なセマンティック知識を強力なトランスフォーマーベースのアーキテクチャに統合することにより、FODA-PGは正確かつ臨床的に一貫性のあるレポートを生成する。
参考スコア（独自算出の注目度）: 26.912139217120874
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automatic Medical Imaging Narrative generation aims to alleviate the workload of radiologists by producing accurate clinical descriptions directly from radiological images. However, the subtle visual nuances and domain-specific terminology in medical images pose significant challenges compared to generic image captioning tasks. Existing approaches often neglect the vital distinction between normal and abnormal findings, leading to suboptimal performance. In this work, we propose FODA-PG, a novel Fine-grained Organ-Disease Adaptive Partitioning Graph framework that addresses these limitations through domain-adaptive learning. FODA-PG constructs a granular graphical representation of radiological findings by separating disease-related attributes into distinct "disease-specific" and "disease-free" categories based on their clinical significance and location. This adaptive partitioning enables our model to capture the nuanced differences between normal and pathological states, mitigating the impact of data biases. By integrating this fine-grained semantic knowledge into a powerful transformer-based architecture and providing rigorous mathematical justifications for its effectiveness, FODA-PG generates precise and clinically coherent reports with enhanced generalization capabilities. Extensive experiments on the IU-Xray and MIMIC-CXR benchmarks demonstrate the superiority of our approach over state-of-the-art methods, highlighting the importance of domain adaptation in medical report generation.
Abstract（参考訳）: オートマチック・メディカル・イメージング・ナラティブ・ジェネレーション(Automatic Medical Imaging Narrative Generation)は、放射線画像から直接正確な臨床記述を作成することにより、放射線医の作業負荷を軽減することを目的としている。しかし、医用画像における微妙な視覚的ニュアンスとドメイン固有の用語は、一般的な画像キャプションタスクと比較して大きな課題を生んでいる。既存のアプローチは、通常と異常な発見の欠如をしばしば無視し、最適以下のパフォーマンスをもたらす。本稿では,ドメイン適応学習を通じてこれらの制約に対処する,新しい組織-分散適応分割グラフフレームワークFODA-PGを提案する。 FODA-PGは, 疾患関連属性を, 臨床的意義と位置に基づいて, 個別の「病原性」と「病原性」のカテゴリーに分離し, 放射線学的所見のグラフィカルな表現を構築した。この適応的パーティショニングにより,本モデルは正常状態と病理状態の微妙な相違を捉え,データバイアスの影響を軽減することができる。この微粒なセマンティック知識を強力なトランスフォーマーベースのアーキテクチャに統合し、その有効性に対する厳密な数学的正当化を提供することで、FODA-PGは、より高度な一般化機能を備えた正確かつ臨床的に一貫性のあるレポートを生成する。 IU-Xray と MIMIC-CXR ベンチマークの大規模な実験により,医療報告生成における領域適応の重要性が示された。

関連論文リスト

Structure-constrained Language-informed Diffusion Model for Unpaired Low-dose Computed Tomography Angiography Reconstruction [72.80209358480424]
ヨウ素化コントラスト培地(ICM)の過剰摂取は、腎臓の損傷と致命的なアレルギー反応を引き起こす。深層学習法は、低線量ICMから正常線量ICMのCT画像を生成することができ、必要な線量を減らすことができる。本研究では,構造シナジーと空間知性を統合した構造制約型言語情報拡散モデル(SLDM)を提案する。
論文参考訳（メタデータ） (2026-01-28T06:54:06Z)
A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。 CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文参考訳（メタデータ） (2025-12-15T10:22:43Z)
DiA-gnostic VLVAE: Disentangled Alignment-Constrained Vision Language Variational AutoEncoder for Robust Radiology Reporting with Missing Modalities [3.5045368873011924]
本稿では,Dentangled Alignment を用いた頑健な放射線診断を行う DiA-gnostic VLVAE を提案する。我々のフレームワークは、共有機能とモダリティ固有の機能を混在させることにより、モダリティの欠如に耐性を持つように設計されている。コンパクトなLLaMA-Xデコーダは、これらの不整合表現を使用してレポートを効率的に生成する。
論文参考訳（メタデータ） (2025-11-08T11:08:27Z)
Diffusion-Based Data Augmentation for Medical Image Segmentation [2.841725244360927]
DiffAugは、テキスト誘導拡散ベースの生成と自動セグメンテーションバリデーションを組み合わせた、新しいフレームワークである。我々のフレームワークは、ベースラインよりも8-10%Diceの改善で最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2025-08-25T09:49:27Z)
Perceptual Evaluation of GANs and Diffusion Models for Generating X-rays [0.7578439720012189]
生成画像モデルは、自然画像と医療画像の両方において顕著な進歩を遂げている。 4つの異常を条件に胸部X線を合成するための最先端生成モデル-GAN(Generative Adversarial Networks)と拡散モデル(Diffusion Models)の有効性を評価する。
論文参考訳（メタデータ） (2025-08-10T00:32:18Z)
Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文参考訳（メタデータ） (2025-04-20T01:54:18Z)
Towards Accurate and Interpretable Neuroblastoma Diagnosis via Contrastive Multi-scale Pathological Image Analysis [16.268045905735818]
病理画像分類に適したコントラスト学習に基づくマルチスケール機能融合モデルであるCMSwinKANを提案する。マルチスケールの特徴を融合させ、対照的な学習戦略を活用することで、CMSwinKANは臨床医の包括的なアプローチを模倣する。その結果、CMSwinKANは、既存の最先端の病理モデルよりも、大規模なデータセットで事前訓練されたモデルよりもパフォーマンスがよいことが示された。
論文参考訳（メタデータ） (2025-04-18T15:39:46Z)
DGSSA: Domain generalization with structural and stylistic augmentation for retinal vessel segmentation [17.396365010722423]
網膜血管形態は糖尿病、緑内障、高血圧などの疾患の診断に重要である。従来のセグメンテーション手法は、トレーニングとテストのデータが同様の分布を共有していると仮定する。本稿では,網膜血管画像分割のための新しいアプローチ DGSSA を提案する。
論文参考訳（メタデータ） (2025-01-07T01:47:57Z)
GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising [1.0138723409205497]
GAN(Generative Adversarial Networks)は低線量CT(LDCT)領域における革命的要素として浮上している。本総説では,GANに基づくLDCT復調技術の急速な進歩を概観する。
論文参考訳（メタデータ） (2024-11-14T15:26:10Z)
Adaptive Aggregation Weights for Federated Segmentation of Pancreas MRI [5.631060921219683]
フェデレートラーニング(FL)は、機密データを共有することなく、機関間で協調的なモデルトレーニングを可能にする。フェデレート平均化(FedAvg)のような従来のFLメソッドは、ドメイン間の一般化において困難に直面している。本稿では適応的なアグリゲーション重みを取り入れた新しいアプローチを提案する。
論文参考訳（メタデータ） (2024-10-29T20:53:01Z)
DiffSeg: A Segmentation Model for Skin Lesions Based on Diffusion Difference [2.9082809324784082]
拡散差に基づく皮膚病変のセグメンテーションモデルDiffSegを紹介する。マルチアウトプット能力は医師のアノテーションの振る舞いを模倣し、セグメンテーション結果の一貫性とあいまいさの可視化を容易にする。我々は,ISIC 2018 ChallengeデータセットにおけるDiffSegの有効性を示す。
論文参考訳（メタデータ） (2024-04-25T09:57:52Z)
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文参考訳（メタデータ） (2024-03-19T09:28:19Z)
VALD-MD: Visual Attribution via Latent Diffusion for Medical Diagnostics [0.0]
医用画像における視覚的属性は、医用画像の診断関連成分を明確にすることを目指している。本稿では、潜在拡散モデルとドメイン固有大言語モデルを組み合わせた新しい生成的視覚属性手法を提案する。結果として生じるシステムは、ゼロショット局所化疾患誘導を含む様々な潜在能力を示す。
論文参考訳（メタデータ） (2024-01-02T19:51:49Z)
ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文参考訳（メタデータ） (2023-09-03T07:55:46Z)
Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-16T07:23:55Z)
Factored Attention and Embedding for Unstructured-view Topic-related Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文参考訳（メタデータ） (2022-03-12T15:24:03Z)
ScoreNet: Learning Non-Uniform Attention and Augmentation for Transformer-Based Histopathological Image Classification [11.680355561258427]
高解像度画像はデジタル病理の進歩を妨げる。パッチベースの処理は、しばしば複数のインスタンス学習(MIL)を組み込んで、画像レベルの予測をもたらす局所的なパッチレベルの表現を集約する。本稿では,組織像分類に適したトランスフォーマーアーキテクチャを提案する。局所的なきめ細かな注意と粗いグローバルな注意機構を組み合わせることで、高解像度画像の意味的な表現を効率的な計算コストで学習する。
論文参考訳（メタデータ） (2022-02-15T16:55:09Z)
Variational Knowledge Distillation for Disease Classification in Chest X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文参考訳（メタデータ） (2021-03-19T14:13:56Z)
Auxiliary Signal-Guided Knowledge Encoder-Decoder for Medical Report Generation [107.3538598876467]
放射線技師の動作パターンを模倣する補助信号誘導知識デコーダ(ASGK)を提案する。 ASGKは、内的特徴融合と外部医療言語情報を統合して、医療知識の伝達と学習をガイドする。
論文参考訳（メタデータ） (2020-06-06T01:00:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。