論文の概要: Boosting Multimodal Federated Learning via Chained Modality Optimization
- arxiv url: http://arxiv.org/abs/2606.01856v1
- Date: Mon, 01 Jun 2026 08:07:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.596858
- Title: Boosting Multimodal Federated Learning via Chained Modality Optimization
- Title(参考訳): 連鎖型モダリティ最適化によるマルチモーダルフェデレート学習の促進
- Authors: Zixin Zhang, Fan Qi, Shuai Li, Xiaoshan Yang, Changsheng Xu,
- Abstract要約: MMFL(Multimodal Federated Learning)は、異種データとモダリティ可用性を備えた分散クライアント間での、プライバシ保護による協調学習を実現する。
これを解決するために,FedMChainを提案する。FedMChainは,多モード学習をモダリティの連鎖として構成する,バランスのとれたMMFLフレームワークである。
このフェーズワイズ設計により、各モダリティは、モダリティ競合を軽減するために、マルチモーダルクライアントに専用の局所最適化ウィンドウを与え、さらにエラー補償正規化器を介して、モダリティ間の相補性を促進する。
- 参考スコア(独自算出の注目度): 69.53075328069504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal Federated Learning (MMFL) enables privacy-preserving collaborative learning across decentralized clients with heterogeneous data and modality availability. However, most existing MMFL methods cast multimodal training as a joint optimization problem, overlooking a key bottleneck: modality competition, where dominant modalities suppress weaker ones and lead to suboptimal global models. To address this, we propose FedMChain, a balanced MMFL framework that structures federated multimodal training as a chain of modality-wise phases. This phase-wise design gives each modality a dedicated local optimization window on multimodal clients to mitigate modality competition, and further promotes cross-modal complementarity via an error-compensated regularizer. On the server side, we employ a sparse sign-guided aggregation strategy that leverages directional sign agreement for robust intra-modality aggregation, avoids destructive averaging, and supports less frequent synchronization to reduce communication overhead. Extensive experiments on multimodal benchmarks demonstrate that FedMChain consistently improves predictive performance while requiring less frequent communication than baselines.
- Abstract(参考訳): MMFL(Multimodal Federated Learning)は、異種データとモダリティ可用性を備えた分散クライアント間での、プライバシ保護による協調学習を実現する。
しかし、既存のMMFL手法の多くは、マルチモーダルトレーニングを共同最適化問題として捉えており、主要なボトルネックであるモーダリティ競争(英語版)を見越して、支配的なモーダリティが弱いモダリティを抑圧し、準最適グローバルモデルをもたらす。
これを解決するために,FedMChainを提案する。FedMChainは,多モード学習をモダリティの連鎖として構成する,バランスのとれたMMFLフレームワークである。
このフェーズワイズ設計により、各モダリティは、モダリティ競合を軽減するために、マルチモーダルクライアントに専用の局所最適化ウィンドウを与え、さらにエラー補償正規化器を介して、モダリティ間の相補性を促進する。
サーバ側では,ロバストなモダリティ内アグリゲーションに指向性サインアグリーメントを利用するスパースサイン誘導アグリゲーション戦略を採用し,破壊的な平均化を回避し,通信オーバヘッドを低減するために頻繁でない同期をサポートする。
マルチモーダルベンチマークの大規模な実験により、FedMChainはベースラインよりも頻繁な通信を必要とせず、予測性能を一貫して改善することが示された。
関連論文リスト
- Balancing Multimodal Learning through Label Space Reshaping [21.889831594837677]
学習ペースの相違は、モダリティ固有の特徴空間と共有ラベル空間とのマッピングの難しさの違いから生じると論じる。
ラベル側設計からマルチモーダルバランスを促進する最初の方法として, BMLR(Ba balanced Multimodal Label Reshaping)を提案する。
論文 参考訳(メタデータ) (2026-05-22T08:22:31Z) - Multi-Paradigm Collaborative Adversarial Attack Against Multi-Modal Large Language Models [67.45032003041399]
本稿では,MLLMに対する敵例の転送可能性を高めるために,MPCAttack(Multi-Paradigm Collaborative Attack)フレームワークを提案する。
MPCOは異なるパラダイム表現の重要性を適応的にバランスさせ、グローバルな最適化を導く。
我々のソリューションは、オープンソースおよびクローズドソースMLLMに対する標的および未ターゲットの攻撃において、常に最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2026-03-05T06:01:26Z) - Modality-Balanced Collaborative Distillation for Multi-Modal Domain Generalization [72.83292830785336]
ウェイト平均化 (WA) は, 平坦な損失景観への収束を促進することによって, 一般化を促進する強力な手法として登場した。
マルチモーダル環境での欠点を克服しつつ,WAの平坦性に起因した優位性を保ちつつ,統一的な共同蒸留フレームワークMBCDを提案する。
論文 参考訳(メタデータ) (2025-11-25T12:38:28Z) - MMiC: Mitigating Modality Incompleteness in Clustered Federated Learning [29.049226511777736]
MFL(Multimodal Federated Learning)におけるモダリティの不完全性を緩和するフレームワークであるMMiCを提案する。
MMiCは、欠落したモダリティの影響を軽減するために、クラスタ内のクライアントモデル内の部分パラメータを置き換える。
また、Banzhaf Power Indexを活用して、これらの条件下でのクライアント選択を最適化する。
論文 参考訳(メタデータ) (2025-05-11T09:12:36Z) - On-the-fly Modulation for Balanced Multimodal Learning [53.616094855778954]
マルチモーダル学習は、異なるモーダルからの情報を統合することでモデル性能を向上させることが期待されている。
広く使われている共同トレーニング戦略は、不均衡で最適化されていないユニモーダル表現につながる。
そこで本研究では,OGM(On-the-fly Prediction Modulation)とOGM(On-the-fly Gradient Modulation)の戦略を提案する。
論文 参考訳(メタデータ) (2024-10-15T13:15:50Z) - Cross-Modal Prototype based Multimodal Federated Learning under Severely Missing Modality [28.90486547668949]
MFCPL (Multimodal Federated Cross Prototype Learning) は、MFLにおいて、高度に欠落したモダリティの下での新たなアプローチである。
MFCPLは、モダリティ共有レベルにおいて、クロスモーダル正規化とクロスモーダルコントラスト機構を備えたモダリティ固有レベルと共に多様なモダリティ知識を提供する。
本手法では,モーダリティに特有な特徴の正規化を実現するために,クロスモーダルアライメントを導入し,全体的な性能を向上させる。
論文 参考訳(メタデータ) (2024-01-25T02:25:23Z) - Overcome Modal Bias in Multi-modal Federated Learning via Balanced Modality Selection [19.284989473603627]
マルチモーダル学習(MFL)のための新しいバランスモード選択フレームワークを提案する。
特定の単一モードの局所的なトレーニングは、すべての局所的なモダリティのトレーニングよりも、グローバルなモデルに寄与する可能性があることを示す。
オーディオ・ビジュアル・カラーグレー・フロントバック・データセットに関する実験は,ベースラインよりもBMSFの方が優れていることを示す。
論文 参考訳(メタデータ) (2023-12-31T05:37:27Z) - FedMFS: Federated Multimodal Fusion Learning with Selective Modality Communication [11.254610576923204]
選択的モーダル通信を用いたFedMFS(Federated Multimodal Fusion Learning)を提案する。
鍵となる考え方は、各デバイスに対するモダリティ選択基準の導入であり、(i)Shapley値解析によって測定されたモダリティの影響を重み付けし、(ii)モダリティモデルサイズを通信オーバーヘッドの指標とする。
実世界のActionSenseデータセットの実験では、FedMFSが複数のベースラインに匹敵する精度を達成し、通信オーバーヘッドを4倍に削減できることを示した。
論文 参考訳(メタデータ) (2023-10-10T22:23:27Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。