論文の概要: Divide, Conquer and Unite: Hierarchical Style-Recalibrated Prototype Alignment for Federated Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2511.10945v1
- Date: Fri, 14 Nov 2025 04:15:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.428524
- Title: Divide, Conquer and Unite: Hierarchical Style-Recalibrated Prototype Alignment for Federated Medical Image Segmentation
- Title(参考訳): 分枝, 結束, 結束: 統合医用画像分割のための階層的スタイル補正型プロトタイプアライメント
- Authors: Xingyue Zhao, Wenke Huang, Xingguang Wang, Haoyu Zhao, Linghao Zhuang, Anwen Jiang, Guancheng Wan, Mang Ye,
- Abstract要約: フェデレートラーニング(Federated Learning)は、複数の医療機関がデータを共有することなく、グローバルなモデルをトレーニングすることを可能にする。
現在のアプローチは主に、重要なマルチレベルキューを見下ろす最終層機能に重点を置いている。
我々は,ドメイン不変のコンテキスト型プロトタイプアライメントを介して特徴表現ギャップをブリッジするFedBCSを提案する。
- 参考スコア(独自算出の注目度): 66.82598255715696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Federated learning enables multiple medical institutions to train a global model without sharing data, yet feature heterogeneity from diverse scanners or protocols remains a major challenge. Many existing works attempt to address this issue by leveraging model representations (e.g., mean feature vectors) to correct local training; however, they often face two key limitations: 1) Incomplete Contextual Representation Learning: Current approaches primarily focus on final-layer features, overlooking critical multi-level cues and thus diluting essential context for accurate segmentation. 2) Layerwise Style Bias Accumulation: Although utilizing representations can partially align global features, these methods neglect domain-specific biases within intermediate layers, allowing style discrepancies to build up and reduce model robustness. To address these challenges, we propose FedBCS to bridge feature representation gaps via domain-invariant contextual prototypes alignment. Specifically, we introduce a frequency-domain adaptive style recalibration into prototype construction that not only decouples content-style representations but also learns optimal style parameters, enabling more robust domain-invariant prototypes. Furthermore, we design a context-aware dual-level prototype alignment method that extracts domain-invariant prototypes from different layers of both encoder and decoder and fuses them with contextual information for finer-grained representation alignment. Extensive experiments on two public datasets demonstrate that our method exhibits remarkable performance.
- Abstract(参考訳): フェデレートラーニングにより、複数の医療機関がデータを共有せずにグローバルモデルをトレーニングできるが、多様なスキャナーやプロトコルから異質性を特徴付けることは大きな課題である。
多くの既存の研究は、局所的なトレーニングを修正するためにモデル表現(例えば、特徴ベクトル)を活用することでこの問題に対処しようとしている。
1)非完全文脈表現学習: 現状のアプローチは、主に最終層の特徴に注目し、重要な多段階の手がかりを見落とし、したがって正確なセグメンテーションに不可欠なコンテキストを希薄化する。
2) レイヤワイズスタイルのバイアス蓄積: 表現を利用することで、グローバルな特徴を部分的に整合させることができるが、これらのメソッドは中間層内のドメイン固有のバイアスを無視し、スタイルの差異を積み上げ、モデルの堅牢性を減らすことができる。
これらの課題に対処するために、ドメイン不変のコンテキストプロトタイプアライメントを介して特徴表現ギャップをブリッジするFedBCSを提案する。
具体的には、コンテンツスタイルの表現を分離するだけでなく、最適なスタイルパラメータを学習することで、より堅牢なドメイン不変のプロトタイプを可能にする。
さらに、エンコーダとデコーダの両方の異なる層からドメイン不変のプロトタイプを抽出し、よりきめ細かな表現アライメントのためのコンテキスト情報と融合する、コンテキスト対応のデュアルレベルプロトタイプアライメント手法を設計する。
2つの公開データセットに対する大規模な実験により,本手法が顕著な性能を示した。
関連論文リスト
- Proto-Former: Unified Facial Landmark Detection by Prototype Transformer [77.47431726595111]
Proto-Formerは、統一的で適応的でエンドツーエンドの顔ランドマーク検出フレームワークである。
統一されたアーキテクチャ内で、複数のデータセットをまたいだ共同トレーニングを可能にする。
Proto-Formerは、既存の最先端手法よりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-17T06:00:25Z) - Few to Big: Prototype Expansion Network via Diffusion Learner for Point Cloud Few-shot Semantic Segmentation [12.971351926107289]
Prototype Expansion Network (PENet) は、2つのアノテートされた特徴源から大容量のプロトタイプを構築するフレームワークである。
PENetは、様々ないくつかのショット設定で最先端のメソッドを著しく上回っている。
論文 参考訳(メタデータ) (2025-09-16T09:29:46Z) - Prototype-Aware Multimodal Alignment for Open-Vocabulary Visual Grounding [11.244257545057508]
Prototype-Aware Multimodal Learning (PAML) は、視覚的・言語的モダリティの不完全整合、クロスモーダルな特徴融合の欠如、意味的プロトタイプ情報の有効利用に対処する革新的なフレームワークである。
我々のフレームワークは,オープン語彙シーンにおける最先端の成果を達成しつつ,標準的な場面での競争性能を示す。
論文 参考訳(メタデータ) (2025-09-08T02:27:10Z) - Prototypical Progressive Alignment and Reweighting for Generalizable Semantic Segmentation [13.24093379138835]
一般化可能なセマンティックセグメンテーションは、目に見えないターゲットドメインでうまく機能することを目的としている。
クラスワイドプロトタイプは、安定性とセマンティック一貫性のために一般化の恩恵を受けるドメイン不変のキューとして機能する。
一般化可能なセマンティックセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-16T06:42:21Z) - Dual Adaptive Representation Alignment for Cross-domain Few-shot
Learning [58.837146720228226]
ベース知識から学習することで、限られたサポートサンプルを持つ新規なクエリを認識することを目的としている。
この設定の最近の進歩は、ベース知識と新しいクエリサンプルが同じドメインに分散されていることを前提としている。
本稿では,ターゲットドメインで利用可能なサンプルが極めて少ないドメイン間数ショット学習の問題に対処することを提案する。
論文 参考訳(メタデータ) (2023-06-18T09:52:16Z) - Contrast, Stylize and Adapt: Unsupervised Contrastive Learning Framework
for Domain Adaptive Semantic Segmentation [18.843639142342642]
画素レベルと特徴レベルの両方で領域ギャップを埋めるためのコントラストFEaTureとpIxelアライメントを提案する。
提案手法はDeepLabV2を用いて既存の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-15T12:50:46Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z) - Cross-domain Detection via Graph-induced Prototype Alignment [114.8952035552862]
カテゴリレベルのドメインアライメントを求めるグラフ誘発プロトタイプアライメント(GPA)フレームワークを提案する。
さらに,クラス不均衡がドメイン適応に与える影響を軽減するために,クラス重み付きコントラスト損失を設計する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-03-28T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。