論文の概要: Federated Cross-Modal Retrieval with Missing Modalities via Semantic Routing and Adapter Personalization
- arxiv url: http://arxiv.org/abs/2604.22885v1
- Date: Fri, 24 Apr 2026 08:31:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.030347
- Title: Federated Cross-Modal Retrieval with Missing Modalities via Semantic Routing and Adapter Personalization
- Title(参考訳): セマンティックルーティングとアダプタパーソナライゼーションによるモダリティの欠如による相互検索
- Authors: Hefeng Zhou, Xuan Liu, Sicheng Chen, Wutong Zhang, Wu Yan, Jiong Lou, Chentao Wu, Guangtao Xue, Wei Zhao, Jie Li,
- Abstract要約: RCSRはパーソナライズフレンドリーなフェデレーションフレームワークで、プロトタイプアンカー、検索中心のセマンティックルーティング、オプションのクライアント固有のアダプタを統合している。
RCSRは、クライアントレベルの検索性能を向上しつつ、グローバルな検索精度とトレーニング安定性を継続的に向上することを示す。
- 参考スコア(独自算出の注目度): 17.752166353809184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Federated cross-modal retrieval faces severe challenges from heterogeneous client data, particularly non-IID semantic distributions and missing modalities. Under such heterogeneity, a single global model is often insufficient to capture both shared cross-modal knowledge and client-specific characteristics. We propose RCSR, a personalization-friendly federated framework that integrates prototype anchoring, retrieval-centric semantic routing, and optional client-specific adapters. Built on a frozen CLIP backbone, RCSR leverages lightweight shared adapters for global knowledge transfer while supporting efficient local personalization. Prototype anchoring helps unimodal clients align with global cross-modal semantics, and a server-side semantic router adaptively assigns aggregation weights based on retrieval consistency to mitigate alignment drift during heterogeneous updates. Extensive experiments on MS-COCO, Flickr30K, and other benchmarks show that RCSR consistently improves global retrieval accuracy and training stability, while further enhancing client-level retrieval performance, especially for clients with incomplete modalities. Code is available at https://github.com/RezinChow/RCSR-Retrieval-Centric-Semantic-Routing.
- Abstract(参考訳): フェデレートされたクロスモーダル検索は、不均一なクライアントデータ、特に非IIDセマンティックな分布と欠落したモダリティから厳しい課題に直面している。
このような異種性の下では、単一のグローバルモデルでは、共有モダル知識とクライアント固有の特性の両方をキャプチャできないことが多い。
本稿では、プロトタイプアンカー、検索中心のセマンティックルーティング、オプションのクライアント固有アダプタを統合したパーソナライズフレンドリーなフェデレーションフレームワークRCSRを提案する。
凍結したCLIPバックボーン上に構築されたRCSRは、グローバルな知識伝達のための軽量な共有アダプタを活用し、効率的なローカルパーソナライゼーションをサポートする。
プロトタイプアンカーは、グローバルなクロスモーダルセマンティクスと一元的クライアントの整合を支援するとともに、サーバサイドセマンティクスルータは、検索整合性に基づいてアライメント重みを適応的に割り当て、異種更新時のアライメントドリフトを緩和する。
MS-COCO、Flickr30K、その他のベンチマークでの大規模な実験により、RCSRはグローバルな検索精度とトレーニングの安定性を一貫して改善し、クライアントレベルの検索性能をさらに向上させ、特に不完全なモダリティを持つクライアントに対して改善することが示された。
コードはhttps://github.com/RezinChow/RCSR-Retrieval-Centric-Semantic-Routingで公開されている。
関連論文リスト
- Aggregation Alignment for Federated Learning with Mixture-of-Experts under Data Heterogeneity [27.791732281031695]
大規模言語モデル(LLM)は、計算量を削減しつつモデルのキャパシティをスケールするために、Mixture-of-Experts (MoE)アーキテクチャを採用するようになっている。
これらのMoEベースのLPMを微調整するには、分散データとプライバシに敏感なデータにアクセスする必要があることが多いため、集中的な微調整は現実的ではない。
我々は、ルーティングの一貫性と専門的なセマンティックアライメントを共同で実施するフェデレーションアライメントアライメントアライメントフレームワークであるFedAlign-MoEを提案する。
論文 参考訳(メタデータ) (2026-03-22T15:07:39Z) - A Federated Many-to-One Hopfield model for associative Neural Networks [0.17398560678845076]
フェデレートラーニングは、生データを共有せずに協調的なトレーニングを可能にする。
我々は、異種連続的な設定で共有アーカイブタイプを学習する連合型連想メモリフレームワークを提案する。
このアプローチはプライバシを保護し、集中的なリプレイバッファを回避し、小さな、ノイズの多い、あるいは進化中のデータセットに対して堅牢である。
論文 参考訳(メタデータ) (2026-03-20T12:37:43Z) - Replacing Parameters with Preferences: Federated Alignment of Heterogeneous Vision-Language Models [63.70401095689976]
パラメータを好みに置き換えることは、よりスケーラブルでプライバシに保護される未来を表している、と私たちは主張する。
ヘテロジニアスVLMのためのGRPOとMixture-of-Rewardsを用いた協調アライメントフレームワークであるMoRを提案する。
MoRは、一般化、堅牢性、およびクロスクライアント適応性において、連邦化されたアライメントベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-01-31T03:11:51Z) - Federated style aware transformer aggregation of representations [2.8882449633642793]
FedSTARは、クライアント固有のスタイル要素を共有コンテンツ表現から切り離す、スタイル対応のフェデレーション学習フレームワークである。
完全なモデルパラメータの代わりに、コンパクトなプロトタイプとスタイルベクターを交換することで、FedSTARは通信オーバーヘッドを大幅に削減する。
論文 参考訳(メタデータ) (2025-11-24T07:24:09Z) - FedRIR: Rethinking Information Representation in Federated Learning [7.765917932796046]
ネットワークエッジのモバイルおよびWeb-of-Things(WoT)デバイスは、機械学習アプリケーションのために膨大な量のデータを生成する。
ネットワークエッジのモバイルおよびWeb-of-Things(WoT)デバイスは、機械学習アプリケーションのために膨大な量のデータを生成する。
論文 参考訳(メタデータ) (2025-02-02T17:17:29Z) - Client-Centric Federated Adaptive Optimization [78.30827455292827]
Federated Learning(FL)は、クライアントが独自のデータをプライベートに保ちながら、協調的にモデルをトレーニングする分散学習パラダイムである。
本稿では,新しいフェデレーション最適化手法のクラスであるフェデレーション中心適応最適化を提案する。
論文 参考訳(メタデータ) (2025-01-17T04:00:50Z) - Federated Contrastive Learning for Personalized Semantic Communication [55.46383524190467]
我々は,パーソナライズされたセマンティックコミュニケーションを支援することを目的とした,協調型コントラスト学習フレームワークを設計する。
FedCLは、複数のクライアントにわたるローカルセマンティックエンコーダと、基地局が所有するグローバルセマンティックデコーダの協調トレーニングを可能にする。
分散クライアント間の異種データセットから生じるセマンティック不均衡問題に対処するために,コントラスト学習を用いてセマンティックセントロイドジェネレータを訓練する。
論文 参考訳(メタデータ) (2024-06-13T14:45:35Z) - Towards Instance-adaptive Inference for Federated Learning [80.38701896056828]
Federated Learning(FL)は、複数のクライアントがローカルトレーニングを集約することで、強力なグローバルモデルを学ぶことができる分散学習パラダイムである。
本稿では,FedInsという新しいFLアルゴリズムを提案する。
我々のFedInsは、Tiny-ImageNet上での通信コストが15%未満で、トップパフォーマンスの手法に対して6.64%の改善など、最先端のFLアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-11T09:58:47Z) - Plug-and-Play Regulators for Image-Text Matching [76.28522712930668]
微細な対応と視覚的セマンティックなアライメントの爆発は、画像とテキストのマッチングにおいて大きな可能性を秘めている。
我々は、メッセージ出力を効率的にエンコードして、コンテキストを自動生成し、モーダル表現を集約する、シンプルだが非常に効果的な2つのレギュレータを開発した。
MSCOCOとFlickr30Kデータセットの実験は、複数のモデルで印象的で一貫したR@1ゲインをもたらすことができることを実証している。
論文 参考訳(メタデータ) (2023-03-23T15:42:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。