論文の概要: FRIEREN: Federated Learning with Vision-Language Regularization for Segmentation
- arxiv url: http://arxiv.org/abs/2510.02114v1
- Date: Thu, 02 Oct 2025 15:21:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.183638
- Title: FRIEREN: Federated Learning with Vision-Language Regularization for Segmentation
- Title(参考訳): FRIEREN: セグメンテーションのためのビジョンランゲージ正規化によるフェデレーションラーニング
- Authors: Ding-Ruei Shen,
- Abstract要約: Federeated Learning (FL)は、セマンティック(SS)タスクのためのプライバシ保護ソリューションで、新しいドメインに適応する。
既存のFLメソッドの多くは、リモートクライアント上のラベル付きデータへのアクセスを前提とするか、あるいは最新のVision Foundation Models(VFM)のパワーを活用できないと仮定している。
本稿では,サーバのラベル付きソースデータセット上でモデルを事前訓練し,未ラベルデータのみを用いてクライアント間でトレーニングする,新規で困難なタスクであるFFREEDGを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Federeated Learning (FL) offers a privacy-preserving solution for Semantic Segmentation (SS) tasks to adapt to new domains, but faces significant challenges from these domain shifts, particularly when client data is unlabeled. However, most existing FL methods unrealistically assume access to labeled data on remote clients or fail to leverage the power of modern Vision Foundation Models (VFMs). Here, we propose a novel and challenging task, FFREEDG, in which a model is pretrained on a server's labeled source dataset and subsequently trained across clients using only their unlabeled data, without ever re-accessing the source. To solve FFREEDG, we propose FRIEREN, a framework that leverages the knowledge of a VFM by integrating vision and language modalities. Our approach employs a Vision-Language decoder guided by CLIP-based text embeddings to improve semantic disambiguation and uses a weak-to-strong consistency learning strategy for robust local training on pseudo-labels. Our experiments on synthetic-to-real and clear-to-adverse-weather benchmarks demonstrate that our framework effectively tackles this new task, achieving competitive performance against established domain generalization and adaptation methods and setting a strong baseline for future research.
- Abstract(参考訳): Federeated Learning(FL)は新しいドメインに適応するためにセマンティックセグメンテーション(SS)タスクのプライバシ保護ソリューションを提供するが、特にクライアントデータがラベル付けされていない場合、これらのドメインシフトによる大きな課題に直面している。
しかしながら、既存のFLメソッドの多くは、リモートクライアント上のラベル付きデータへのアクセスを非現実的に仮定するか、あるいは現代のビジョン財団モデル(VFM)のパワーを活用できないと仮定している。
本稿では,サーバのラベル付きソースデータセット上でモデルを事前訓練し,未ラベルデータのみを使用してクライアント間でトレーニングする,新たな課題であるFFREEDGを提案する。
FFREEDG を解決するために,視覚と言語モダリティを統合することで VFM の知識を活用するフレームワーク FRIEREN を提案する。
提案手法では,CLIPベースのテキスト埋め込みによってガイドされるビジョン・ランゲージ・デコーダを用いて意味の曖昧さを改善するとともに,擬似ラベルを用いた堅牢な局所学習に弱い一貫性学習戦略を用いる。
本研究では,本手法が本手法を効果的に実現し,既存の領域の一般化・適応手法と競合する性能を達成し,今後の研究の基盤となることを実証した。
関連論文リスト
- An Empirical Study of Federated Prompt Learning for Vision Language Model [89.2963764404892]
本稿では,言語プロンプト学習(VPT)と視覚プロンプト学習(VLM)の行動的差異を系統的に検討する。
我々は、FPL(Federated Prompt Learning)の堅牢性を評価するために、クライアントスケール、集約戦略、即時長といった様々なFLと迅速な構成の影響を評価する。
論文 参考訳(メタデータ) (2025-05-29T03:09:15Z) - VLMs meet UDA: Boosting Transferability of Open Vocabulary Segmentation with Unsupervised Domain Adaptation [3.776249047528669]
本稿では、ビジョンランゲージ推論と教師なしドメイン適応(UDA)の鍵戦略を統合することにより、多様なドメイン間のセグメンテーション精度を向上させることを提案する。
提案したFROVSS(Foundational-Retaining Open Vocabulary)フレームワークにおいて,VLMの細粒度セグメンテーション機能の改善を,マルチスケールのコンテキストデータ,即時拡張による堅牢なテキスト埋め込み,レイヤワイズ微調整により実現した。
結果として生じるUDA-FROVフレームワークは、共有カテゴリを必要とせずにドメイン間で効果的に適応する最初のUDAアプローチである。
論文 参考訳(メタデータ) (2024-12-12T12:49:42Z) - Empowering Source-Free Domain Adaptation via MLLM-Guided Reliability-Based Curriculum Learning [7.2523602603838535]
Source-Free Domain Adaptation (SFDA)は、未ラベルのターゲットデータのみを使用して、トレーニング済みのソースモデルをターゲットドメインに適応することを目的としている。
本稿では,SFDAにおける擬似ラベルによる知識活用のために,複数のMLLMを統合する新しいフレームワークである$textbfReliability-based Curriculum Learning (RCL)$を提案する。
RCLは複数のSFDAベンチマーク(例えば$textbf+9.4%$)でSOTA(State-of-the-art)のパフォーマンスを達成し、ソースデータへのアクセスを必要とせずに適応性と堅牢性を向上させる効果を実証している。
論文 参考訳(メタデータ) (2024-05-28T17:18:17Z) - FedEGG: Federated Learning with Explicit Global Guidance [90.04705121816185]
フェデレートラーニング(FL)は、そのプライバシー保護の性質から、多様なアプリケーションにとって大きな可能性を秘めている。
既存の手法は、最適化ベースのクライアント制約、適応的なクライアント選択、事前訓練されたモデルや合成データの使用によってこれらの課題に対処するのに役立つ。
我々はbftextFedEGGを提案する。bftextFedEGGは、よく定義された、容易に収束できる学習タスクを用いて、グローバルガイドタスクを構築する新しいFLアルゴリズムである。
論文 参考訳(メタデータ) (2024-04-18T04:25:21Z) - 3FM: Multi-modal Meta-learning for Federated Tasks [2.117841684082203]
マルチモーダルなフェデレーションタスクに特化して設計されたメタラーニングフレームワークを提案する。
当社のアプローチは,新たなモダリティに曝露した場合に,フェデレーションモデルによる堅牢な適応を可能にする必要性に起因している。
提案アルゴリズムは,欠落したモダリティシナリオのサブセットにおいて,ベースラインよりも優れた性能を実現することを示す。
論文 参考訳(メタデータ) (2023-12-15T20:03:24Z) - The Unreasonable Effectiveness of Large Language-Vision Models for
Source-free Video Domain Adaptation [56.61543110071199]
Source-Free Video Unsupervised Domain Adaptation (SFVUDA)タスクは、ラベル付きソースデータセットでトレーニングされたアクション認識モデルを、ラベル付きターゲットデータセットに適応させることによって構成される。
従来のアプローチでは、ターゲットデータ自体から派生した自己スーパービジョンを活用してSFVUDAに対処しようと試みてきた。
我々は、LLVMがドメインシフトに対して驚くほど堅牢になる前に、リッチな世界を含むという理論によって、LLVM(Large Language-Vision Models)から"web-supervision"を利用するアプローチを取る。
論文 参考訳(メタデータ) (2023-08-17T18:12:05Z) - Learning Across Domains and Devices: Style-Driven Source-Free Domain
Adaptation in Clustered Federated Learning [32.098954477227046]
本稿では,クライアントのデータをラベル付けせず,サーバが事前学習のためにラベル付きデータセットにアクセスする新しいタスクを提案する。
実験の結果,我々のアルゴリズムは既存の手法よりも効率よく新しい課題に取り組むことができることがわかった。
論文 参考訳(メタデータ) (2022-10-05T15:23:52Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。