論文の概要: FedBPrompt: Federated Domain Generalization Person Re-Identification via Body Distribution Aware Visual Prompts
- arxiv url: http://arxiv.org/abs/2603.12912v1
- Date: Fri, 13 Mar 2026 11:29:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:12.063735
- Title: FedBPrompt: Federated Domain Generalization Person Re-Identification via Body Distribution Aware Visual Prompts
- Title(参考訳): FedBPrompt: ビジュアルプロンプトを意識した身体分布によるフェデレーション・ドメイン一般化担当者の再同定
- Authors: Xin Xu, Weilong Li, Wei Liu, Wenke Huang, Zhixi Yu, Bin Yang, Xiaoying Liao, Kui Jiang,
- Abstract要約: 視覚変換器(ViT)は広く採用されているが、その世界的な注目は、歩行者を高い類似点や多様な視点から区別することができないことが多い。
これを解決するために,FedBPrompt (FedBPrompt) を意識したFederated Body Distributionを提案する。
FedBPromptは、トランスフォーマーの注意を歩行者中心の地域へと導くための学習可能な視覚的プロンプトを導入した。
- 参考スコア(独自算出の注目度): 48.952949805624904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Federated Domain Generalization for Person Re-Identification (FedDG-ReID) learns domain-invariant representations from decentralized data. While Vision Transformer (ViT) is widely adopted, its global attention often fails to distinguish pedestrians from high similarity backgrounds or diverse viewpoints -- a challenge amplified by cross-client distribution shifts in FedDG-ReID. To address this, we propose Federated Body Distribution Aware Visual Prompt (FedBPrompt), introducing learnable visual prompts to guide Transformer attention toward pedestrian-centric regions. FedBPrompt employs a Body Distribution Aware Visual Prompts Mechanism (BAPM) comprising: Holistic Full Body Prompts to suppress cross-client background noise, and Body Part Alignment Prompts to capture fine-grained details robust to pose and viewpoint variations. To mitigate high communication costs, we design a Prompt-based Fine-Tuning Strategy (PFTS) that freezes the ViT backbone and updates only lightweight prompts, significantly reducing communication overhead while maintaining adaptability. Extensive experiments demonstrate that BAPM effectively enhances feature discrimination and cross-domain generalization, while PFTS achieves notable performance gains within only a few aggregation rounds. Moreover, both BAPM and PFTS can be easily integrated into existing ViT-based FedDG-ReID frameworks, making FedBPrompt a flexible and effective solution for federated person re-identification. The code is available at https://github.com/leavlong/FedBPrompt.
- Abstract(参考訳): Federated Domain Generalization for Person Re-Identification (FedDG-ReID)は分散データからドメイン不変表現を学習する。
ViT(Vision Transformer)は広く採用されているが、その世界的な注目は、歩行者を高い類似性背景や多様な視点から区別することに失敗することが多い。
そこで本研究では,歩行者中心の領域にトランスフォーマーの注意を誘導する学習可能な視覚的プロンプトを導入したフェデレーションボディ分布認識視覚プロンプト(FedBPrompt)を提案する。
FedBPromptは、クロスクライアントバックグラウンドノイズを抑制するためのホロスティックフルボディプロンプットと、ポーズや視点の変化に頑丈なきめ細かな詳細を捉えるためのボディパートアライメントプロンプット(Body Part Alignment Prompts)で構成される、BAPM(Body Distribution Aware Visual Prompts Mechanism)を採用している。
通信コストの低減を図るため,VTバックボーンを凍結し,軽量なプロンプトのみを更新し,適応性を維持しながら通信オーバーヘッドを大幅に低減するPFTSを設計した。
BAPMは特徴識別とクロスドメインの一般化を効果的に促進し、PFTSはわずか数ラウンドで顕著な性能向上を達成している。
さらに、BAPMとPFTSは、既存のViTベースのFedDG-ReIDフレームワークに容易に統合でき、フェデレートされた人物の再識別のための柔軟で効果的なソリューションとなる。
コードはhttps://github.com/leavlong/FedBPrompt.comで入手できる。
関連論文リスト
- FedAPT: Federated Adversarial Prompt Tuning for Vision-Language Models [97.35577473867296]
Federated Adversarial Prompt Tuning (textbfFedAPT)は、FPTの対向性を高めるために設計された新しい手法である。
この問題に対処するために,テキストプロンプトから視覚的なプロンプトを生成するtextbfclass-awareプロンプトジェネレータを提案する。
複数の画像分類データセットの実験は、対向ロバスト性を改善する上でFedAPTの優位性を示している。
論文 参考訳(メタデータ) (2025-09-03T03:46:35Z) - FedReFT: Federated Representation Fine-Tuning with All-But-Me Aggregation [12.544628972135905]
本稿では,クライアントの隠れ表現を微調整する新しい手法であるFederated Representation Fine-Tuning(FedReFT)を紹介する。
FedReFTは、隠された表現を直接操作するためにスパース介入層を適用し、軽量でセマンティックにリッチな微調整の代替を提供する。
We evaluate FedReFT on commonsense reasoning, arithmetic reasoning, instruction-tuning, and GLUE。
論文 参考訳(メタデータ) (2025-08-27T22:03:19Z) - Prompt Disentanglement via Language Guidance and Representation Alignment for Domain Generalization [75.88719716002014]
ドメイン一般化 (Domain Generalization, DG) は、目に見えないターゲットドメインに対して効果的に機能する汎用モデルの開発を目指している。
VFM(Pre-trained Visual Foundation Models)の最近の進歩は、ディープラーニングモデルの一般化能力を向上する大きな可能性を示している。
VFMの制御可能で柔軟な言語プロンプトを活用することで,この問題に対処することを提案する。
論文 参考訳(メタデータ) (2025-07-03T03:52:37Z) - Unlocking the Potential of Prompt-Tuning in Bridging Generalized and
Personalized Federated Learning [49.72857433721424]
Vision Transformer (ViT) と Visual Prompt Tuning (VPT) は、様々なコンピュータビジョンタスクの効率を改善して最先端のパフォーマンスを実現する。
本稿では,GFL(Generalized FL)とPFL(Personalized FL)を組み合わせた新しいアルゴリズムSGPTを提案する。
論文 参考訳(メタデータ) (2023-10-27T17:22:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。