論文の概要: SPICE: Synergy and Partial Information Based Curriculum Evolution
- arxiv url: http://arxiv.org/abs/2606.16639v1
- Date: Mon, 15 Jun 2026 12:27:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.543482
- Title: SPICE: Synergy and Partial Information Based Curriculum Evolution
- Title(参考訳): SPICE: シナジーと部分情報に基づくカリキュラム進化
- Authors: Ankush Pratap Singh, Houwei Cao, Yong Liu,
- Abstract要約: マルチモーダル学習は異質なモーダルをまたいだ相補的な情報を利用する。
既存のマルチモーダルカリキュラム学習戦略では、サンプルの相対的な複雑さはトレーニングを通して変化しないと仮定している。
マルチモーダルインタラクション学習のための新しいプログレッシブカリキュラムフレームワークであるSPICEを提案する。
- 参考スコア(独自算出の注目度): 11.645594774207511
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal learning exploits complementary information across heterogeneous modalities. The informativeness of each modality can vary widely across samples and training stages. Existing multimodal curriculum learning strategies often assume that the relative complexity of samples remains unchanged throughout training and therefore cannot adapt to model evolution. We propose SPICE (Synergy and Partial Information based Curriculum Evolution), a novel progressive curriculum framework for multimodal interaction learning. Guided by Partial Information Decomposition (PID) theory, our approach decomposes multimodal interactions into redundant, unique, and synergistic information components, enabling an interpretable and dynamic characterization of sample complexity. Building on this decomposition, we design a progressive curriculum that evolves throughout training, allowing the model to transition from learning shared cross-modal cues to modality-specific patterns and, finally, to complex synergistic interactions. Adapting to model evolution, sample ordering is refined in real-time using PID information estimates derived from unimodal and multimodal predictions. Experiments across multiple multimodal benchmarks demonstrate consistent improvements over conventional training and state-of-the-art baselines, highlighting the effectiveness of PID information decomposition and adaptive sample ordering for multimodal curriculum learning.
- Abstract(参考訳): マルチモーダル学習は異質なモーダルをまたいだ相補的な情報を利用する。
それぞれのモダリティの情報性は、サンプルや訓練段階によって大きく異なる。
既存のマルチモーダルカリキュラム学習戦略は、サンプルの相対的な複雑さがトレーニングを通して変化しないため、モデル進化に適応できないと仮定することが多い。
Synergy and partial Information based Curriculum Evolution, SPICE (Synergy and partial information based Curriculum Evolution) は,マルチモーダルインタラクション学習のための新しいプログレッシブカリキュラムフレームワークである。
部分情報分解(PID)理論で導かれた本手法は,多モーダル相互作用を冗長,一意,シナジスティックな情報成分に分解し,標本の複雑さを解釈可能かつ動的に特徴づける。
この分解に基づいて、我々は、学習を通して進化する漸進的なカリキュラムを設計し、モデルが共有モーダルキューからモダリティ固有のパターンへと移行し、最終的には複雑な相乗的相互作用へと移行することを可能にする。
モデル進化に適応して、単調および多モーダル予測から導かれるPID情報推定を用いて、サンプル注文をリアルタイムに洗練する。
複数のマルチモーダルベンチマークの実験は、従来のトレーニングや最先端のベースラインよりも一貫した改善を示し、多モーダルカリキュラム学習におけるPID情報の分解と適応的なサンプル順序付けの有効性を強調した。
関連論文リスト
- Information-Theoretic Decomposition for Multimodal Interaction Learning [22.0664097791142]
マルチモーダル学習は、モダリティ全体にわたって冗長でユニークな、シナジスティックな情報を取得することに焦点を当てている。
批判的だが未発見の課題は、暗黙の相互作用がサンプル間で動的に変化することである。
本稿では,このような動的,サンプル特異的な相互作用を学習することが,効果的なマルチモーダル学習に重要であることを示す,最初の体系的,情報理論的な分析法を提案する。
論文 参考訳(メタデータ) (2026-06-10T03:27:13Z) - Quantifying Multimodal Capabilities: Formal Generalization Guarantees in Pairwise Metric Learning [16.068927747527606]
本稿では,マルチモーダル計量学習モデルの一般化特性に関する理論的解析を行う。
我々は、異なるモジュラリティ部分集合に対応する関数クラス間の階層的関係を確立し、学習された写像と基底真理の間の相違を定量化する。
上界と下界の双方で得られた結果は,微粒なモジュラリティ特徴を取り入れることで,モジュラリティ相補性を高めることにより仮説空間の複雑さを減少させることを示した。
論文 参考訳(メタデータ) (2026-05-02T12:44:43Z) - Multi-modal Co-learning for Earth Observation: Enhancing single-modality models via modality collaboration [9.66105329596482]
推論の特定のモダリティを目標にすることなく、様々なタスクを一般化できる新しいマルチモーダル・コラーニングフレームワークを提案する。
我々のアプローチは、対照的かつモダリティの識別学習を組み合わせ、単一のモダリティモデルを誘導し、内部モデル多様体をモダリティ共有およびモダリティ固有情報に構造化する。
論文 参考訳(メタデータ) (2025-10-22T13:29:32Z) - From Complexity to Parsimony: Integrating Latent Class Analysis to Uncover Multimodal Learning Patterns in Collaborative Learning [0.0]
本研究では,Multimodal Learning Analytics(MMLA)に潜在クラス分析(LCA)を統合する新しい手法を提案する。
LCAは、協調コミュニケーション(Collaborative Communication)、身体的コラボレーション(Embodied Collaboration)、遠隔インタラクション(Distant Interaction)、孤独エンゲージメント(Solitary Engagement)の4つの異なるクラスを特定した。
疫学ネットワーク分析は、これらのマルチモーダル指標を元のモノモーダル指標と比較し、マルチモーダルアプローチがより相似であることを発見した。
論文 参考訳(メタデータ) (2024-11-23T15:36:35Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - Multimodal Representation Learning by Alternating Unimodal Adaptation [73.15829571740866]
MLA(Multimodal Learning with Alternating Unimodal Adaptation)を提案する。
MLAは、それを交互に一助学習プロセスに変換することで、従来の共同マルチモーダル学習プロセスを再構築する。
共有ヘッドを通じてモーダル間相互作用をキャプチャし、異なるモーダル間で連続的な最適化を行う。
実験は5つの多様なデータセットで行われ、完全なモダリティを持つシナリオと、欠落したモダリティを持つシナリオを含む。
論文 参考訳(メタデータ) (2023-11-17T18:57:40Z) - Unified Multi-modal Unsupervised Representation Learning for
Skeleton-based Action Understanding [62.70450216120704]
教師なしの事前訓練は骨格に基づく行動理解において大きな成功を収めた。
我々はUmURLと呼ばれる統一マルチモーダル非教師なし表現学習フレームワークを提案する。
UmURLは効率的な早期融合戦略を利用して、マルチモーダル機能を単一ストリームで共同でエンコードする。
論文 参考訳(メタデータ) (2023-11-06T13:56:57Z) - Learning Unseen Modality Interaction [54.23533023883659]
マルチモーダル学習は、すべてのモダリティの組み合わせが訓練中に利用でき、クロスモーダル対応を学ぶことを前提としている。
我々は、目に見えないモダリティ相互作用の問題を提起し、第1の解を導入する。
異なるモジュラリティの多次元的特徴を、豊富な情報を保存した共通空間に投影するモジュールを利用する。
論文 参考訳(メタデータ) (2023-06-22T10:53:10Z) - Relating by Contrasting: A Data-efficient Framework for Multimodal
Generative Models [86.9292779620645]
生成モデル学習のための対照的なフレームワークを開発し、モダリティ間の共通性だけでなく、「関連」と「関連しない」マルチモーダルデータの区別によってモデルを訓練することができる。
提案手法では, 生成モデルを用いて, 関係のないサンプルから関連サンプルを正確に識別し, ラベルのない多モードデータの利用が可能となる。
論文 参考訳(メタデータ) (2020-07-02T15:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。