論文の概要: PID-Guided Partial Alignment for Multimodal Decentralized Federated Learning
- arxiv url: http://arxiv.org/abs/2601.10012v1
- Date: Thu, 15 Jan 2026 02:42:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:18.962142
- Title: PID-Guided Partial Alignment for Multimodal Decentralized Federated Learning
- Title(参考訳): 多モード分散フェデレーション学習のためのPID誘導部分アライメント
- Authors: Yanhang Shi, Xiaoyu Wang, Houwei Cao, Jian Li, Yong Liu,
- Abstract要約: DFLでは、モノリシック表現はユニモーダルエージェントとマルチモーダルエージェントの間の勾配のずれを誘導する。
サーバレス環境で部分的な情報分解を運用するマルチモーダルDFLフレームワークであるPARSEを提案する。
- 参考スコア(独自算出の注目度): 17.34276804368286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal decentralized federated learning (DFL) is challenging because agents differ in available modalities and model architectures, yet must collaborate over peer-to-peer (P2P) networks without a central coordinator. Standard multimodal pipelines learn a single shared embedding across all modalities. In DFL, such a monolithic representation induces gradient misalignment between uni- and multimodal agents; as a result, it suppresses heterogeneous sharing and cross-modal interaction. We present PARSE, a multimodal DFL framework that operationalizes partial information decomposition (PID) in a server-free setting. Each agent performs feature fission to factorize its latent representation into redundant, unique, and synergistic slices. P2P knowledge sharing among heterogeneous agents is enabled by slice-level partial alignment: only semantically shareable branches are exchanged among agents that possess the corresponding modality. By removing the need for central coordination and gradient surgery, PARSE resolves uni-/multimodal gradient conflicts, thereby overcoming the multimodal DFL dilemma while remaining compatible with standard DFL constraints. Across benchmarks and agent mixes, PARSE yields consistent gains over task-, modality-, and hybrid-sharing DFL baselines. Ablations on fusion operators and split ratios, together with qualitative visualizations, further demonstrate the efficiency and robustness of the proposed design.
- Abstract(参考訳): エージェントは利用可能なモダリティやモデルアーキテクチャが異なるが、中央コーディネータを使わずにピアツーピア(P2P)ネットワーク上で協調する必要があるため、DFL(Multimodal decentralized Federated Learning)は難しい。
標準的なマルチモーダルパイプラインは、すべてのモダリティにまたがる単一の共有埋め込みを学ぶ。
DFLでは、そのようなモノリシックな表現はユニモーダルエージェントとマルチモーダルエージェントの間の勾配の不整合を誘導し、結果として不均一な共有と相互モーダル相互作用を抑制する。
サーバレス環境で部分情報分解(PID)を運用するマルチモーダルDFLフレームワークであるPARSEを提案する。
各エージェントはその潜在表現を冗長でユニークでシナジスティックなスライスに分解するために特徴フィッションを実行する。
不均一なエージェント間のP2P知識共有はスライスレベルの部分的アライメントによって実現され、意味的に共有可能なブランチのみが対応するモダリティを持つエージェント間で交換される。
PARSEは, 集中的整合・勾配手術の必要性を排除し, 一様/多様勾配障害を解消し, 標準的DFL制約に適合しながら, マルチモーダルDFLジレンマを克服する。
ベンチマークとエージェントの混合により、PARSEはタスク、モダリティ、ハイブリッド共有DFLベースラインよりも一貫した利得を得る。
融合演算子と分割比のアブレーションと定性的可視化は、提案した設計の効率性と堅牢性をさらに証明している。
関連論文リスト
- DCG ReID: Disentangling Collaboration and Guidance Fusion Representations for Multi-modal Vehicle Re-Identification [26.52384456327148]
マルチモーダル車両リID(DCG-ReID)におけるディスタングル協調と誘導融合表現を提案する。
具体的には、相互干渉を伴わない不均一な品質分散モーダルデータを切り離すために、まず動的信頼に基づくDCDW(Disentangling Weighting)機構を設計する。
筆者らは,(1)品質分布の均衡化,(CFM)コラボレーション・フュージョン・モジュール(CFM)が共有識別情報の収集とクラス内整合性向上のために相互にコンセンサス特性をマイニングすること,(2)不均衡分布の調整,(GFM)誘導融合モジュール(GFM)が支配的モダリティの強化のために偏差増幅を実装していること,の2つのシナリオ特異的融合戦略を開発した。
論文 参考訳(メタデータ) (2026-01-06T11:09:19Z) - Bridging Modalities via Progressive Re-alignment for Multimodal Test-Time Adaptation [39.02105398462778]
テスト時間適応(TTA)は、未ラベルのテストデータのみを使用したオンラインモデル適応を可能にする。
マルチモーダルのシナリオでは、異なるモダリティをまたいだ分布の度合いの変化は複雑なカップリング効果をもたらす。
本稿では,BriMPR(Progressive Re-alignment)によるブリッジングモダリティ( Bridging Modalities)と呼ばれる新しいTTAフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-28T03:33:42Z) - Modality-Collaborative Low-Rank Decomposers for Few-Shot Video Domain Adaptation [74.16390314862801]
FSVDA(Few-Shot Video Domain Adaptation)の課題について検討する。
モダリティ・ユニクティック・モダリティ・共有特徴を分解するために,モダリティ・コラボレーティブ・ローランク・デコンポスタ(MC-LRD)の新たなフレームワークを導入する。
我々のモデルは既存の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-11-24T03:09:59Z) - Disentangled Federated Learning for Tackling Attributes Skew via
Invariant Aggregation and Diversity Transferring [104.19414150171472]
属性は、クライアント間の一貫した最適化方向から、現在の連邦学習(FL)フレームワークを歪めます。
本稿では,ドメイン固有属性とクロス不変属性を2つの補足枝に分離するために,非絡み付きフェデレーション学習(DFL)を提案する。
実験により、DFLはSOTA FL法と比較して高い性能、より良い解釈可能性、より高速な収束率でFLを促進することが確認された。
論文 参考訳(メタデータ) (2022-06-14T13:12:12Z) - Abstractive Sentence Summarization with Guidance of Selective Multimodal
Reference [3.505062507621494]
モーダル間の相互関係を考慮したマルチモーダル階層選択変換器(mhsf)モデルを提案する。
提案したmhsfモデルの汎用性を,事前学習+微調整および新鮮トレーニング戦略を用いて評価した。
論文 参考訳(メタデータ) (2021-08-11T09:59:34Z) - Learning Deep Multimodal Feature Representation with Asymmetric
Multi-layer Fusion [63.72912507445662]
本稿では,マルチモーダルな特徴を複数の層に融合する,コンパクトで効果的なフレームワークを提案する。
我々は、エンコーダ内のモダリティ固有のバッチ正規化層を単に維持するだけで、共有シングルネットワーク内でマルチモーダル機能を学習できることを検証する。
次に,マルチモーダルな特徴を段階的に活用できる双方向多層融合方式を提案する。
論文 参考訳(メタデータ) (2021-08-11T03:42:13Z) - Deep Multimodal Fusion by Channel Exchanging [87.40768169300898]
本稿では,異なるモードのサブネットワーク間で動的にチャネルを交換するパラメータフリーマルチモーダル融合フレームワークを提案する。
このような交換プロセスの有効性は、畳み込みフィルタを共有してもBN層をモダリティで分離しておくことで保証される。
論文 参考訳(メタデータ) (2020-11-10T09:53:20Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。