論文の概要: CO-EVO: Co-evolving Semantic Anchoring and Style Diversification for Federated DG-ReID
- arxiv url: http://arxiv.org/abs/2604.26363v1
- Date: Wed, 29 Apr 2026 07:18:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.289201
- Title: CO-EVO: Co-evolving Semantic Anchoring and Style Diversification for Federated DG-ReID
- Title(参考訳): CO-EVO:フェデレートDG-ReIDのセマンティックアンコリングとスタイルの多様化を共同で進める
- Authors: Fengchun Zhang, Qiang Ma, Liuyu Xiang, Jinshan Lai, Tingxuan Huang, Jianwei Hu,
- Abstract要約: CO-EVOは、共進化的なメカニズムを通じてセマンティックスタイルの競合を解決する新しいフレームワークである。
我々は,CO-EVOが最先端(SOTA)性能を達成することを示し,意味的浄化とスタイル拡張の相乗効果が堅牢なクロスドメイン一般化に不可欠であることを証明した。
- 参考スコア(独自算出の注目度): 6.125592777256908
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Federated domain generalization for person re-identification (FedDG-ReID) aims to collaboratively train a pedestrian retrieval model across multiple decentralized source domains such that it can generalize to unseen target environments without compromising raw data privacy. However, this task is significantly challenged by the inherent stylistic gaps across decentralized clients. Without global supervision, models easily succumb to shortcut learning where representations overfit to domain specific camera biases rather than universal identity features. We propose CO-EVO, a novel federated framework that resolves this semantic-style conflict through a co-evolutionary mechanism. On the semantic side, Camera-Invariant Semantic Anchoring (CSA) learns identity prompts with cross-camera consistency to establish purified and domain-agnostic anchors that filter out local imaging noise. On the visual side, Global Style Diversification (GSD), powered by a Global Camera-Style Bank (GCSB), synthesizes realistic perturbations to expand the visual boundaries of training data. The core of CO-EVO is its co-evolutionary loop where purified anchors act as gravitational centers to guide the image encoder toward robust anatomical attributes amidst diverse style variations. Extensive experiments demonstrate that CO-EVO achieves state-of-the-art (SOTA) performance, proving that the synergy between semantic purification and style expansion is essential for robust cross-domain generalization. Our code is available at: https://github.com/NanYiyuzurn/ACL-LGPS-2026.
- Abstract(参考訳): FedDG-ReID(Federated Domain Generalization for person re-identification)は、複数の分散型ソースドメインにわたる歩行者検索モデルを協調的にトレーニングすることを目的としている。
しかし、このタスクは、分散化されたクライアント間の固有のスタイリスティックなギャップによって、非常に困難である。
グローバルな監視がなければ、モデルは、普遍的なアイデンティティ機能ではなく、ドメイン固有のカメラバイアスに過剰な表現が適合する学習をショートカットする。
我々は,このセマンティックスタイルの対立を,共進化機構を通じて解決する,新しいフェデレーションフレームワークであるCO-EVOを提案する。
セマンティック側では、カメラ不変セマンティックアンカリング(CSA)は、カメラ間の一貫性を持ったアイデンティティプロンプトを学習し、局所的な画像ノイズを除去する純粋でドメインに依存しないアンカーを確立する。
視覚面では、Global Camera-Style Bank (GCSB) を動力とするGlobal Style Diversification (GSD) は、現実的な摂動を合成し、トレーニングデータの視覚的境界を広げる。
CO-EVOのコアは、多様なスタイルの変動の中で、画像エンコーダを堅牢な解剖学的特性へ導くために、精製されたアンカーが重力中心として機能する共進化ループである。
大規模な実験によりCO-EVOは最先端(SOTA)性能を達成し、意味的浄化とスタイル拡張の相乗効果が堅牢なクロスドメイン一般化に不可欠であることが証明された。
私たちのコードは、https://github.com/NanYiyuzurn/ACL-LGPS-2026で利用可能です。
関連論文リスト
- Seeking Consensus: Geometric-Semantic On-the-Fly Recalibration for Open-Vocabulary Remote Sensing Semantic Segmentation [27.476148859056114]
SeeCoは、リモートセンシング画像におけるトレーニング不要のOVSSモデルのパフォーマンスを向上させるための、プラグアンドプレイフレームワークである。
デュアルコンセンサスを求めることにより、任意のOVSSモデルをオンザフライで再分類する。
8つのリモートセンシングOVSSベンチマークの実験は、一貫した利得を示している。
論文 参考訳(メタデータ) (2026-04-29T01:57:21Z) - ASTRA: Enhancing Multi-Subject Generation with Retrieval-Augmented Pose Guidance and Disentangled Position Embedding [1.4145309506833208]
ASTRAは、ポーズ構造から被写体を遠ざける新しいフレームワークである。
ASTRAはDreamBenchで高いアイデンティティとテキストアライメントを維持しながら、新しい最先端のポーズアテンデンスを実現している。
論文 参考訳(メタデータ) (2026-04-15T14:50:05Z) - UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。
既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。
高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文 参考訳(メタデータ) (2025-12-15T02:59:16Z) - Enhancing Cross-View Geo-Localization Generalization via Global-Local Consistency and Geometric Equivariance [20.376805098370067]
クロスビューなジオローカライゼーションは、大きく異なる視点から捉えた同じ位置の画像をマッチングすることを目的としている。
クロスドメインの一般化を促進するための新しいCVGLフレームワークであるEGSを提案する。
EGSは一貫して大幅なパフォーマンス向上を実現し、クロスドメインCVGLにおける新しい最先端技術を確立している。
論文 参考訳(メタデータ) (2025-09-25T02:35:21Z) - HCCM: Hierarchical Cross-Granularity Contrastive and Matching Learning for Natural Language-Guided Drones [29.663691563826095]
自然言語誘導ドローン(NLGD)は、ターゲットマッチングやナビゲーションといったタスクに新しいパラダイムを提供する。
ドローンシナリオにおける広い視野と複雑な構成意味論は、視覚言語理解の課題を提起する。
階層的クロスグラニュラリティコントラストとマッチング学習フレームワークを2つのコンポーネントで提案する。
論文 参考訳(メタデータ) (2025-08-29T11:50:24Z) - Referring Remote Sensing Image Segmentation with Cross-view Semantics Interaction Network [65.01521002836611]
本稿では,これらの制約を解決するために,並列で統一されたセグメンテーション・フレームワークであるクロスビューセマンティック・インタラクション・ネットワーク(CSINet)を提案する。
関心の対象を観察する際の人間の行動によって動機づけられたネットワークは、遠隔および近距離からの視覚的手がかりを編成し、相乗的予測を行う。
すべてのエンコーディングステージでは、Cross-View Window-attention Module(CVWin)を使用して、グローバルおよびローカルセマンティクスをクローズビューおよびリモートビューブランチ機能に補完する。
論文 参考訳(メタデータ) (2025-08-02T11:57:56Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Towards Generalizable Person Re-identification with a Bi-stream
Generative Model [81.0989316825134]
そこで我々は,BGM (Bi-stream Generative Model) を提案する。
提案手法は,大規模な一般化可能なre-IDベンチマークにおいて,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-06-19T09:18:25Z) - A U-Net Based Discriminator for Generative Adversarial Networks [86.67102929147592]
GAN(Generative Adversarial Network)のための代替U-Netベースの識別器アーキテクチャを提案する。
提案アーキテクチャにより,合成画像のグローバルコヒーレンスを維持しつつ,画素単位の詳細なフィードバックを生成元に提供することができる。
斬新な判別器は、標準分布と画像品質の指標の観点から、最先端の技術を向上する。
論文 参考訳(メタデータ) (2020-02-28T11:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。