論文の概要: Efficient Generalization via Multimodal Co-Training under Data Scarcity and Distribution Shift
- arxiv url: http://arxiv.org/abs/2510.07509v1
- Date: Wed, 08 Oct 2025 20:13:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.713192
- Title: Efficient Generalization via Multimodal Co-Training under Data Scarcity and Distribution Shift
- Title(参考訳): データスカシティと配電シフト下におけるマルチモーダルコライニングによる効率的な一般化
- Authors: Tianyu Bell Pan, Damon L. Woodard,
- Abstract要約: マルチモーダルコトレーニングは、ラベル付きデータが制限された状況におけるモデル一般化を強化するように設計されている。
この枠組みの理論的基礎を考察し、ラベルなしデータの使用が一般化の著しい改善につながる条件を導出する。
我々は、初めてマルチモーダルなコトレーニングコンテキストにおいて、ラベルのないマルチモーダルデータを活用することで得られる利点を分解し、定量化する新しい一般化境界を確立する。
- 参考スコア(独自算出の注目度): 0.6331016589903705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores a multimodal co-training framework designed to enhance model generalization in situations where labeled data is limited and distribution shifts occur. We thoroughly examine the theoretical foundations of this framework, deriving conditions under which the use of unlabeled data and the promotion of agreement between classifiers for different modalities lead to significant improvements in generalization. We also present a convergence analysis that confirms the effectiveness of iterative co-training in reducing classification errors. In addition, we establish a novel generalization bound that, for the first time in a multimodal co-training context, decomposes and quantifies the distinct advantages gained from leveraging unlabeled multimodal data, promoting inter-view agreement, and maintaining conditional view independence. Our findings highlight the practical benefits of multimodal co-training as a structured approach to developing data-efficient and robust AI systems that can effectively generalize in dynamic, real-world environments. The theoretical foundations are examined in dialogue with, and in advance of, established co-training principles.
- Abstract(参考訳): 本稿では,ラベル付きデータに制限があり,分散シフトが発生する状況において,モデル一般化を促進するために設計されたマルチモーダル協調学習フレームワークについて検討する。
この枠組みの理論的基礎を徹底的に検討し、ラベルのないデータの使用と異なるモダリティのための分類器間の合意の促進が一般化の著しい改善につながった条件を導出する。
また,分類誤りの低減における反復的コトレーニングの有効性を検証した収束解析も提案する。
さらに,ラベルのないマルチモーダルデータの活用,ビュー間の合意の促進,条件付きビューの独立性の維持から得られる,明確なメリットを分解し,定量化する。
我々の研究は、動的で現実世界の環境を効果的に一般化できるデータ効率で堅牢なAIシステムを開発するための構造化アプローチとして、マルチモーダルコトレーニングの実践的メリットを強調した。
理論の基礎は、確立された協調学習原則と対話し、その前に検討される。
関連論文リスト
- Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence [83.15764564701706]
本稿では、コーシーシュワルツの発散を相互情報と統合して視覚言語アライメントを行う新しいフレームワークを提案する。
CS分散はInfoNCEのアライメント・ユニフォーム性競合にシームレスに対処し,InfoNCEと補完的な役割を担っていることがわかった。
テキスト・画像生成およびモダリティ横断検索タスクの実験により,本手法が視覚言語アライメントに与える影響を実証した。
論文 参考訳(メタデータ) (2025-02-24T10:29:15Z) - Towards the Generalization of Multi-view Learning: An Information-theoretical Analysis [28.009990407017618]
我々は多視点学習のための情報理論の一般化境界を開発する。
我々は、新しいデータ依存バウンダリを、Left-one-outとSupersample設定の両方で導き出す。
補間体制では、多視点学習のための高速な境界がさらに確立される。
論文 参考訳(メタデータ) (2025-01-28T07:47:19Z) - A Statistical Theory of Contrastive Pre-training and Multimodal Generative AI [18.974297347310287]
マルチモーダル生成AIシステムは、異なるモーダルの表現を学ぶために、対照的な事前学習に依存している。
本稿では、下流タスクにおける対照的な事前学習の成功を説明するための理論的枠組みを開発する。
論文 参考訳(メタデータ) (2025-01-08T17:47:06Z) - Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm [14.980926991441345]
介入データを含むデータセットは,データ分布に関する現実的な仮定の下で効果的に抽出可能であることを示す。
本稿では,観察的および介入的設定における各変数の限界分布の比較に依拠する,介入忠実性の新たな変種を紹介する。
また、多数の単一変数の介入を含むデータセットから因果順序を推測するアルゴリズムであるIntersortを導入する。
論文 参考訳(メタデータ) (2024-05-28T16:07:17Z) - Unifying Perspectives: Plausible Counterfactual Explanations on Global, Group-wise, and Local Levels [2.494108084558292]
本稿では,微分可能なモデルに対する勾配に基づく最適化手法を提案する。
インスタンスグループ化と逆ファクト生成を1つの効率的なプロセスに組み合わせることで,GWCF生成を特に強化する。
本研究は, グループ粒度を最適化しつつ, 妥当性, 近接性, 妥当性のバランスをとる方法の有効性を示すものである。
論文 参考訳(メタデータ) (2024-05-27T20:32:09Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Enhancing multimodal cooperation via sample-level modality valuation [10.677997431505815]
そこで本研究では,各サンプルに対するモダリティの寄与を評価するために,サンプルレベルのモダリティ評価指標を提案する。
モダリティ評価によって、モダリティの相違は、データセットレベルでのグローバルな貢献相違を超えて、実際にサンプルレベルで異なる可能性があることが分かる。
本手法は, 微細なユニモーダル・コントリビューションを合理的に観察し, 大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-09-12T14:16:34Z) - Networked Communication for Decentralised Agents in Mean-Field Games [59.01527054553122]
平均フィールドゲームフレームワークにネットワーク通信を導入する。
当社のアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを証明しています。
ネットワーク化されたアプローチは、障害の更新や人口規模の変化に対する堅牢性という点において、両方の選択肢に対して大きなメリットがあることが示されています。
論文 参考訳(メタデータ) (2023-06-05T10:45:39Z) - Synergies between Disentanglement and Sparsity: Generalization and
Identifiability in Multi-Task Learning [79.83792914684985]
我々は,最大スパース基底予測器が不整合表現をもたらす条件を提供する新しい識別可能性の結果を証明した。
この理論的な結果から,両レベル最適化問題に基づくアンタングル表現学習の実践的アプローチを提案する。
論文 参考訳(メタデータ) (2022-11-26T21:02:09Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。