論文の概要: Maximum Likelihood Estimation for Multimodal Learning with Missing
Modality
- arxiv url: http://arxiv.org/abs/2108.10513v1
- Date: Tue, 24 Aug 2021 03:50:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-25 14:27:36.935997
- Title: Maximum Likelihood Estimation for Multimodal Learning with Missing
Modality
- Title(参考訳): 欠落モダリティをもつマルチモーダル学習における最大確率推定
- Authors: Fei Ma, Xiangxiang Xu, Shao-Lun Huang, Lin Zhang
- Abstract要約: そこで本研究では,モダリティ欠落データに知識を組み込むために,最大推定値に基づく効率的な手法を提案する。
トレーニングデータの95%がモダリティを欠いている場合でも,提案手法の有効性を示す。
- 参考スコア(独自算出の注目度): 10.91899856969822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal learning has achieved great successes in many scenarios. Compared
with unimodal learning, it can effectively combine the information from
different modalities to improve the performance of learning tasks. In reality,
the multimodal data may have missing modalities due to various reasons, such as
sensor failure and data transmission error. In previous works, the information
of the modality-missing data has not been well exploited. To address this
problem, we propose an efficient approach based on maximum likelihood
estimation to incorporate the knowledge in the modality-missing data.
Specifically, we design a likelihood function to characterize the conditional
distribution of the modality-complete data and the modality-missing data, which
is theoretically optimal. Moreover, we develop a generalized form of the
softmax function to effectively implement maximum likelihood estimation in an
end-to-end manner. Such training strategy guarantees the computability of our
algorithm capably. Finally, we conduct a series of experiments on real-world
multimodal datasets. Our results demonstrate the effectiveness of the proposed
approach, even when 95% of the training data has missing modality.
- Abstract(参考訳): マルチモーダル学習は多くのシナリオで大きな成功を収めた。
一元学習と比較して、異なるモダリティからの情報を効果的に組み合わせて学習タスクの性能を向上させることができる。
実際、マルチモーダルデータはセンサーの故障やデータ伝送エラーといった様々な理由により、モダリティを欠いている可能性がある。
以前の研究では、モダリティを許容するデータの情報は十分に活用されていない。
この問題に対処するために,最大推定値に基づく効率的な手法を提案し,その知識をモダリティ欠落データに組み込む。
具体的には、モーダリティ完全データと理論的に最適であるモーダリティ完全データの条件分布を特徴付ける可能性関数を設計する。
さらに,ソフトマックス関数の一般化形式を開発し,最大推定値をエンドツーエンドに効果的に実装する。
このようなトレーニング戦略は,アルゴリズムの計算可能性を保証する。
最後に,実世界のマルチモーダルデータセットに関する一連の実験を行う。
トレーニングデータの95%がモダリティを欠いている場合でも,提案手法の有効性を示す。
関連論文リスト
- MMP: Towards Robust Multi-Modal Learning with Masked Modality Projection [10.909746391230206]
マルチモーダル学習は、下流タスクの性能を高めるために、複数の入力源からのデータを組み合わせることを目指している。
欠落したモダリティを処理できる既存の方法は、各入力モダリティの組み合わせに対するカスタムトレーニングまたは適応ステップを含む。
そこで我々は,MMP (Masked Modality Projection) を提案する。
論文 参考訳(メタデータ) (2024-10-03T21:41:12Z) - Missing Modality Prediction for Unpaired Multimodal Learning via Joint Embedding of Unimodal Models [6.610033827647869]
実世界のシナリオでは、完全なマルチモーダルデータを一貫して取得することは重大な課題である。
これはしばしば、特定のモダリティのデータが欠落しているモダリティの問題につながる。
自己教師型共同埋め込み学習手法を用いて, パラメータ効率のよい未学習モデルの微調整を行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-17T14:44:25Z) - Borrowing Treasures from Neighbors: In-Context Learning for Multimodal Learning with Missing Modalities and Data Scarcity [9.811378971225727]
本稿では、欠落したモダリティに関する現在の研究を低データ体制に拡張する。
フルモダリティデータと十分なアノテートされたトレーニングサンプルを取得することは、しばしばコストがかかる。
本稿では,この2つの重要な問題に対処するために,検索強化したテキスト内学習を提案する。
論文 参考訳(メタデータ) (2024-03-14T14:19:48Z) - Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Multimodal Representation Learning by Alternating Unimodal Adaptation [73.15829571740866]
MLA(Multimodal Learning with Alternating Unimodal Adaptation)を提案する。
MLAは、それを交互に一助学習プロセスに変換することで、従来の共同マルチモーダル学習プロセスを再構築する。
共有ヘッドを通じてモーダル間相互作用をキャプチャし、異なるモーダル間で連続的な最適化を行う。
実験は5つの多様なデータセットで行われ、完全なモダリティを持つシナリオと、欠落したモダリティを持つシナリオを含む。
論文 参考訳(メタデータ) (2023-11-17T18:57:40Z) - Learning Unseen Modality Interaction [54.23533023883659]
マルチモーダル学習は、すべてのモダリティの組み合わせが訓練中に利用でき、クロスモーダル対応を学ぶことを前提としている。
我々は、目に見えないモダリティ相互作用の問題を提起し、第1の解を導入する。
異なるモジュラリティの多次元的特徴を、豊富な情報を保存した共通空間に投影するモジュールを利用する。
論文 参考訳(メタデータ) (2023-06-22T10:53:10Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - Information Maximizing Curriculum: A Curriculum-Based Approach for
Imitating Diverse Skills [14.685043874797742]
本稿では,各データポイントに重みを割り当て,表現可能なデータに特化するようにモデルに促すカリキュラムベースのアプローチを提案する。
すべてのモードをカバーし、多様な振る舞いを可能にするため、我々は、各ミックスコンポーネントが学習のためのトレーニングデータの独自のサブセットを選択する、専門家(MoE)ポリシーの混合にアプローチを拡張します。
データセットの完全なカバレッジを実現するために,新たな最大エントロピーに基づく目標を提案する。
論文 参考訳(メタデータ) (2023-03-27T16:02:50Z) - Greedy Modality Selection via Approximate Submodular Maximization [19.22947539760366]
マルチモーダル学習は、異質な情報ソースを融合することを目的としたマルチモーダルデータからの学習を検討する。
メモリ制約のため、利用可能なすべてのモダリティを活用することが常に可能であるとは限らない。
本研究では,ある計算制約の下で最も情報的かつ補完的なモダリティを効率的に選択することを目的としたモダリティ選択について検討する。
論文 参考訳(メタデータ) (2022-10-22T22:07:27Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Task-Feature Collaborative Learning with Application to Personalized
Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。
具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。
実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文 参考訳(メタデータ) (2020-04-29T02:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。