論文の概要: LLM-driven Medical Report Generation via Communication-efficient Heterogeneous Federated Learning
- arxiv url: http://arxiv.org/abs/2506.17562v1
- Date: Sat, 21 Jun 2025 03:13:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.477467
- Title: LLM-driven Medical Report Generation via Communication-efficient Heterogeneous Federated Learning
- Title(参考訳): コミュニケーション効率不均一なフェデレーション学習によるLCM駆動型医療報告生成
- Authors: Haoxuan Che, Haibo Jin, Zhengrui Guo, Yi Lin, Cheng Jin, Hao Chen,
- Abstract要約: 我々は,医療報告生成(MRG)モデルのプライバシ保護,マルチセンター開発を可能にするフレームワークであるFedMRGを提案する。
FL-LLMチューニングにおける通信オーバヘッドの基本的な課題を低ランク因子化を用いて解決する。
MRGエンコーダにおけるクライアント認識のコントラスト学習によりFedMRGをさらに強化し,診断誘導のプロンプトを併用した。
- 参考スコア(独自算出の注目度): 9.388460099839318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLMs have demonstrated significant potential in Medical Report Generation (MRG), yet their development requires large amounts of medical image-report pairs, which are commonly scattered across multiple centers. Centralizing these data is exceptionally challenging due to privacy regulations, thereby impeding model development and broader adoption of LLM-driven MRG models. To address this challenge, we present FedMRG, the first framework that leverages Federated Learning (FL) to enable privacy-preserving, multi-center development of LLM-driven MRG models, specifically designed to overcome the critical challenge of communication-efficient LLM training under multi-modal data heterogeneity. To start with, our framework tackles the fundamental challenge of communication overhead in FL-LLM tuning by employing low-rank factorization to efficiently decompose parameter updates, significantly reducing gradient transmission costs and making LLM-driven MRG feasible in bandwidth-constrained FL settings. Furthermore, we observed the dual heterogeneity in MRG under the FL scenario: varying image characteristics across medical centers, as well as diverse reporting styles and terminology preferences. To address this, we further enhance FedMRG with (1) client-aware contrastive learning in the MRG encoder, coupled with diagnosis-driven prompts, which capture both globally generalizable and locally distinctive features while maintaining diagnostic accuracy; and (2) a dual-adapter mutual boosting mechanism in the MRG decoder that harmonizes generic and specialized adapters to address variations in reporting styles and terminology. Through extensive evaluation of our established FL-MRG benchmark, we demonstrate the generalizability and adaptability of FedMRG, underscoring its potential in harnessing multi-center data and generating clinically accurate reports while maintaining communication efficiency.
- Abstract(参考訳): LLMは医療報告生成(MRG)において大きな可能性を示しているが、その開発には大量の医療画像とレポートのペアが必要である。
これらのデータの集中化は、プライバシ規制のために非常に難しいため、モデル開発やLLM駆動MRGモデルのより広範な採用を妨げる。
この課題に対処するために、フェデレートラーニング(FL)を利用した最初のフレームワークであるFedMRGを紹介し、LLM駆動型MRGモデルのプライバシー保護とマルチセンター開発を可能にする。
まず,パラメータ更新を効率よく分解し,遅延伝送コストを大幅に削減し,帯域幅制約のFL設定でLLM駆動MRGを実現することにより,FL-LLMチューニングにおける通信オーバーヘッドの基本的な課題に取り組む。
さらに, FLシナリオ下ではMRGの二重不均一性, 医療センター間でのイメージ特性の変化, 各種報告スタイル, 用語嗜好の相違が観察された。
そこで我々は,(1) MRGエンコーダにおけるクライアント認識のコントラスト学習と,2) 診断精度を維持しながらグローバルに一般化可能な特徴と局所的な特徴の両方を捉え,(2) MRGデコーダにおける汎用的および特殊なアダプタを調和させて,報告スタイルや用語のバリエーションに対処するデュアルアダプタ相互強化機構を,診断駆動のプロンプトと組み合わせることで,FedMRGをさらに強化する。
確立したFL-MRGベンチマークを広範囲に評価することにより,FedMRGの汎用性と適応性を実証し,多施設データの活用と,コミュニケーション効率を維持しつつ,臨床的に正確な報告を作成できる可能性を明らかにした。
関連論文リスト
- GM-LDM: Latent Diffusion Model for Brain Biomarker Identification through Functional Data-Driven Gray Matter Synthesis [4.336463644962463]
本研究では,遅延拡散モデル(LDM)を利用してMRI生成タスクの効率と精度を向上させる新しいフレームワークであるGM-LDMを紹介する。
GM-LDMは、大規模なABCD MRIデータセットで事前訓練された3Dオートエンコーダを統合し、KL分散損失による統計的一貫性を達成する。
このフレームワークは、機能的ネットワーク接続(FNC)データなどの条件データを柔軟に組み込んで、パーソナライズされた脳画像、バイオマーカーの識別、統合失調症のような脳疾患のための機能的構造情報翻訳を可能にする。
論文 参考訳(メタデータ) (2025-06-15T04:51:31Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - FedSKD: Aggregation-free Model-heterogeneous Federated Learning using Multi-dimensional Similarity Knowledge Distillation [7.944298319589845]
フェデレートラーニング(FL)は、直接データを共有することなく、プライバシー保護のための協調モデルトレーニングを可能にする。
MHFL(Model-heterogeneous FL)は、クライアントが計算資源やアプリケーション固有のニーズに合わせて、不均一なアーキテクチャでパーソナライズされたモデルを訓練することを可能にする。
ピアツーピア(P2P)FLはサーバ依存を除去するが、モデルドリフトと知識の希釈に悩まされ、不均一な設定での有効性が制限される。
ラウンドロビンモデル循環による直接知識交換を容易にする新しいMHFLフレームワークであるFedSKDを提案する。
論文 参考訳(メタデータ) (2025-03-23T05:33:10Z) - LLM-RG4: Flexible and Factual Radiology Report Generation across Diverse Input Contexts [14.72366043711941]
現在の放射線学レポート生成モデルは、固定的なタスクパラダイムに制約されている。
本稿ではLLM-RG4という新しい大規模言語モデル(LLM)に基づくRRGフレームワークを提案する。
我々のモデルは入力非依存の幻覚を最小限に抑えているのに対し、現在のオープンソースモデルは一般的にこの問題に悩まされている。
論文 参考訳(メタデータ) (2024-12-16T17:29:51Z) - FedLPPA: Learning Personalized Prompt and Aggregation for Federated Weakly-supervised Medical Image Segmentation [1.6013679829631893]
フェデレートラーニング(FL)は、ポリシーやプライバシの懸念によって引き起こされるデータサイロの課題を効果的に緩和する。
従来の集中型FLモデルは、特に医学的文脈において、多様なマルチセンターデータに対応している。
医用画像セグメンテーションのための不均一な弱い監督を均一に活用するために,学習可能なプロンプトとアグリゲーション(FedLPPA)を備えた新規なパーソナライズFLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-27T13:41:32Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Customizing General-Purpose Foundation Models for Medical Report
Generation [64.31265734687182]
ラベル付き医用画像-レポートペアの不足は、ディープニューラルネットワークや大規模ニューラルネットワークの開発において大きな課題となっている。
本稿では,コンピュータビジョンと自然言語処理の基盤モデル (FM) として,市販の汎用大規模事前学習モデルのカスタマイズを提案する。
論文 参考訳(メタデータ) (2023-06-09T03:02:36Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。