論文の概要: Spatio-Temporal Representation Decoupling and Enhancement for Federated Instrument Segmentation in Surgical Videos
- arxiv url: http://arxiv.org/abs/2506.23759v1
- Date: Mon, 30 Jun 2025 12:08:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.039084
- Title: Spatio-Temporal Representation Decoupling and Enhancement for Federated Instrument Segmentation in Surgical Videos
- Title(参考訳): 手術映像におけるFederated Instrument Segmentationの時空間表現デカップリングと拡張
- Authors: Zheng Fang, Xiaoming Qi, Chun-Mei Feng, Jialun Pei, Weixin Si, Yueming Jin,
- Abstract要約: 我々は、パーソナライズされたFLスキーム、時空間表現デカップリングと拡張(FedST)を提案する。
FedSTは、局所サイトトレーニングとグローバルサーバトレーニングの両方において、外科的ドメイン知識を賢く活用し、セグメンテーションを強化する。
我々のモデルは、ローカルサイトトレーニングにおいてRepresentation separation and Cooperation(RSC)メカニズムを採用し、クエリの埋め込み層を個別に分離し、それぞれのバックグラウンドをエンコードする。
- 参考スコア(独自算出の注目度): 17.212640372275466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surgical instrument segmentation under Federated Learning (FL) is a promising direction, which enables multiple surgical sites to collaboratively train the model without centralizing datasets. However, there exist very limited FL works in surgical data science, and FL methods for other modalities do not consider inherent characteristics in surgical domain: i) different scenarios show diverse anatomical backgrounds while highly similar instrument representation; ii) there exist surgical simulators which promote large-scale synthetic data generation with minimal efforts. In this paper, we propose a novel Personalized FL scheme, Spatio-Temporal Representation Decoupling and Enhancement (FedST), which wisely leverages surgical domain knowledge during both local-site and global-server training to boost segmentation. Concretely, our model embraces a Representation Separation and Cooperation (RSC) mechanism in local-site training, which decouples the query embedding layer to be trained privately, to encode respective backgrounds. Meanwhile, other parameters are optimized globally to capture the consistent representations of instruments, including the temporal layer to capture similar motion patterns. A textual-guided channel selection is further designed to highlight site-specific features, facilitating model adapta tion to each site. Moreover, in global-server training, we propose Synthesis-based Explicit Representation Quantification (SERQ), which defines an explicit representation target based on synthetic data to synchronize the model convergence during fusion for improving model generalization.
- Abstract(参考訳): FL(Federated Learning)の下での手術器具のセグメンテーションは有望な方向であり、複数の外科的部位がデータセットを集中せずに協調的にモデルを訓練することができる。
しかし、外科データ科学には極めて限定的なFL法が存在するため、他の手法では外科領域に固有の特徴を考慮していない。
一 異なるシナリオは、多彩な解剖学的背景を示す一方、非常に類似した楽器表現
二 大規模合成データ生成を最小限の努力で促進する外科的シミュレータが存在すること。
本稿では,局所およびグローバルサーバのトレーニングにおいて,外科領域の知識を賢く活用し,セグメンテーションを増強するパーソナライズドFLスキームであるSpatio-Temporal Recoupling and Enhancement(FedST)を提案する。
具体的には、ローカルサイトトレーニングにおいてRepresentation Separation and Cooperation(RSC)メカニズムを採用し、クエリの埋め込み層を個別に分離し、それぞれのバックグラウンドをエンコードする。
一方、他のパラメータは、同様の動きパターンをキャプチャする時間層を含む、楽器の一貫性のある表現を捉えるために、グローバルに最適化されている。
さらに、サイト固有の特徴を強調し、各サイトへのモデル適応を容易にするために、テキスト誘導チャネル選択が設計されている。
さらに、グローバルサーバトレーニングにおいて、モデル一般化を改善するために融合中にモデル収束を同期させる合成データに基づいて、明示的表現ターゲットを定義する合成ベースの明示的表現量子化(SERQ)を提案する。
関連論文リスト
- Generative Autoregressive Transformers for Model-Agnostic Federated MRI Reconstruction [5.519160766363227]
FedGATは、生成的自己回帰変換器に基づくモデルに依存しないFL技術である。
Controllablyは、自動回帰予測を通じて、所望のサイトから現実的なMR画像を合成する。
各サイトは、ハイブリッドデータセット上で独自の再構築モデルをトレーニングする。
論文 参考訳(メタデータ) (2025-02-06T21:45:16Z) - Stragglers-Aware Low-Latency Synchronous Federated Learning via Layer-Wise Model Updates [71.81037644563217]
同期フェデレーションラーニング(FL)は、協調エッジラーニングの一般的なパラダイムである。
一部のデバイスは計算資源が限られており、様々な可用性があるため、FLレイテンシはストラグラーに非常に敏感である。
本稿では,NNの最適化手法をバックプロパゲーションにより活用し,グローバルモデルを階層的に更新するストラグラー対応層対応学習(SALF)を提案する。
論文 参考訳(メタデータ) (2024-03-27T09:14:36Z) - Unifying and Personalizing Weakly-supervised Federated Medical Image
Segmentation via Adaptive Representation and Aggregation [1.121358474059223]
フェデレートラーニング(FL)は、データプライバシとセキュリティを損なうことなく、複数のサイトが協力して強力なディープモデルをトレーニングすることを可能にする。
微粒な監督を施した弱く監督されたセグメンテーションは、アノテーションコストを下げる大きな可能性を秘めているため、ますます注目されている。
医用画像セグメンテーションのための新しいFLフレームワークであるFedICRAを提案する。
論文 参考訳(メタデータ) (2023-04-12T06:32:08Z) - FedDM: Iterative Distribution Matching for Communication-Efficient
Federated Learning [87.08902493524556]
フェデレートラーニング(FL)は近年、学術や産業から注目を集めている。
我々は,複数の局所的代理関数からグローバルなトレーニング目標を構築するためのFedDMを提案する。
そこで本研究では,各クライアントにデータ集合を構築し,元のデータから得られた損失景観を局所的にマッチングする。
論文 参考訳(メタデータ) (2022-07-20T04:55:18Z) - One Model to Unite Them All: Personalized Federated Learning of
Multi-Contrast MRI Synthesis [5.3963856146595095]
学習ベースのMRI翻訳は、ソースコントラストをターゲットコントラスト画像にマッピングする合成モデルを含む。
ここでは、MRI合成のための最初のパーソナライズされたFL法(pFL Synth)を紹介する。
pFL Synthは、個々のサイトやソース・ターゲットのコントラストに固有の潜伏剤を生成するマッパーを備えた敵モデルに基づいている。
論文 参考訳(メタデータ) (2022-07-13T20:14:16Z) - Personalizing Federated Medical Image Segmentation via Local Calibration [9.171482226385551]
ひとつのモデルを使って、異なるサイトからさまざまなデータ分布に適応することは、非常に難しい。
現場間一貫性を活用するために,textbfLocal textbfCalibration (LC-Fed) を用いたパーソナライズドフェデレーションフレームワークを提案する。
提案手法は,最先端のパーソナライズされたFL法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-11T06:30:31Z) - Style-Hallucinated Dual Consistency Learning for Domain Generalized
Semantic Segmentation [117.3856882511919]
本稿では、ドメインシフトを処理するためのStyle-HAllucinated Dual consistEncy Learning(SHADE)フレームワークを提案する。
SHADEは3つの実世界のデータセットの平均mIoUに対して5.07%と8.35%の精度で改善し、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-04-06T02:49:06Z) - Federated and Generalized Person Re-identification through Domain and
Feature Hallucinating [88.77196261300699]
人物再識別(re-ID)におけるフェデレーションドメイン一般化(FedDG)の問題について検討する。
一般化された局所的・グローバルなモデルを学ぶための多様な特徴を創出する手法として,DFH (Domain and Feature Hallucinating) を提案する。
提案手法は4つの大規模re-IDベンチマークにおいてFedDGの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-05T09:15:13Z) - Multimodal Semantic Scene Graphs for Holistic Modeling of Surgical
Procedures [70.69948035469467]
カメラビューから3Dグラフを生成するための最新のコンピュータビジョン手法を利用する。
次に,手術手順の象徴的,意味的表現を統一することを目的としたマルチモーダルセマンティックグラフシーン(MSSG)を紹介する。
論文 参考訳(メタデータ) (2021-06-09T14:35:44Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。