論文の概要: Generative Distribution Prediction: A Unified Approach to Multimodal Learning
- arxiv url: http://arxiv.org/abs/2502.07090v1
- Date: Mon, 10 Feb 2025 22:30:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:10:48.853538
- Title: Generative Distribution Prediction: A Unified Approach to Multimodal Learning
- Title(参考訳): 生成的分布予測:マルチモーダル学習への統一的アプローチ
- Authors: Xinyu Tian, Xiaotong Shen,
- Abstract要約: 本稿では、構造的および非構造的モダリティ間の予測性能を高めるために、生成分布予測(GDP)を導入する。
GDPはモデルに依存しず、どんな高忠実な生成モデルとも互換性があり、ドメイン適応のためのトランスファーラーニングをサポートする。
我々は,4つの教師付き学習課題(タブラルデータ予測,質問応答,イメージキャプション,適応的量子回帰)におけるGDPの有効性を実証的に検証した。
- 参考スコア(独自算出の注目度): 4.3108820946281945
- License:
- Abstract: Accurate prediction with multimodal data-encompassing tabular, textual, and visual inputs or outputs-is fundamental to advancing analytics in diverse application domains. Traditional approaches often struggle to integrate heterogeneous data types while maintaining high predictive accuracy. We introduce Generative Distribution Prediction (GDP), a novel framework that leverages multimodal synthetic data generation-such as conditional diffusion models-to enhance predictive performance across structured and unstructured modalities. GDP is model-agnostic, compatible with any high-fidelity generative model, and supports transfer learning for domain adaptation. We establish a rigorous theoretical foundation for GDP, providing statistical guarantees on its predictive accuracy when using diffusion models as the generative backbone. By estimating the data-generating distribution and adapting to various loss functions for risk minimization, GDP enables accurate point predictions across multimodal settings. We empirically validate GDP on four supervised learning tasks-tabular data prediction, question answering, image captioning, and adaptive quantile regression-demonstrating its versatility and effectiveness across diverse domains.
- Abstract(参考訳): マルチモーダルなデータアクセスによる正確な予測 表、テキスト、ビジュアルインプットまたはアウトプットは、多様なアプリケーションドメインにおける分析の進歩に不可欠である。
従来のアプローチは、高い予測精度を維持しながら、異種データタイプを統合するのに苦労することが多い。
本稿では,多モード合成データ生成を利用する新しいフレームワークである生成分布予測(GDP)を導入し,構造的および非構造的モダリティ間の予測性能を向上させる。
GDPはモデルに依存しず、どんな高忠実な生成モデルとも互換性があり、ドメイン適応のための移行学習をサポートする。
我々は、GDPの厳密な理論基盤を確立し、拡散モデルを生成バックボーンとして使用する際の予測精度に関する統計的保証を提供する。
データ生成分布を推定し、リスク最小化のために様々な損失関数に適応することにより、GDPはマルチモーダルな設定で正確なポイント予測を可能にする。
我々は,4つの教師付き学習課題(タブラルデータ予測,質問応答,イメージキャプション,適応的量子回帰)に対してGDPを実証的に検証し,その汎用性と多種多様な領域における有効性を実証した。
関連論文リスト
- UTSD: Unified Time Series Diffusion Model [13.555837288440946]
多領域確率分布をモデル化するために、初めて統一時系列拡散モデルを確立する。
我々は、主要なベンチマークで広範な実験を行い、事前訓練されたUTSDは、すべてのデータドメインにおける既存の基礎モデルより優れています。
論文 参考訳(メタデータ) (2024-12-04T06:42:55Z) - Conformal Prediction for Multimodal Regression [0.0]
コンフォメーション予測は 今や 方法論を通して マルチモーダルな文脈に拡張されています
本研究は,マルチモーダル情報を組み合わせた収束点から抽出した内部ニューラルネットワーク機能の可能性を明らかにする。
この機能は、マルチモーダルデータに富んだ領域にコンフォメーション予測を展開するための新しい経路を舗装する。
論文 参考訳(メタデータ) (2024-10-25T15:56:39Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Transfer Learning for Diffusion Models [43.10840361752551]
拡散モデルは高品質な合成サンプルを一貫して生成する。
コレクションコストや関連するリスクのため、現実のアプリケーションでは実用的ではありません。
本稿では,従来の微調整法や正規化法とは異なる新しいアプローチであるTransfer Guided Diffusion Process (TGDP)を紹介する。
論文 参考訳(メタデータ) (2024-05-27T06:48:58Z) - When Rigidity Hurts: Soft Consistency Regularization for Probabilistic
Hierarchical Time Series Forecasting [69.30930115236228]
確率的階層的時系列予測は時系列予測の重要な変種である。
ほとんどの手法は点予測に焦点を絞っており、確率的確率分布を十分に調整していない。
ProFHiTは,階層全体の予測分布を共同でモデル化する完全確率的階層予測モデルである。
論文 参考訳(メタデータ) (2023-10-17T20:30:16Z) - Causality-oriented robustness: exploiting general additive interventions [3.871660145364189]
本稿では因果性指向のロバスト性に着目し,不変勾配(DRIG)を用いた分布ロバスト性を提案する。
線形環境では、DRIGがデータ依存の分布シフトのクラスの中で頑健な予測を得られることを証明している。
我々は、予測性能をさらに向上させるために、半教師付きドメイン適応設定にアプローチを拡張した。
論文 参考訳(メタデータ) (2023-07-18T16:22:50Z) - When Rigidity Hurts: Soft Consistency Regularization for Probabilistic
Hierarchical Time Series Forecasting [69.30930115236228]
確率的階層的時系列予測は時系列予測の重要な変種である。
ほとんどの手法は点予測に焦点を絞っており、確率的確率分布を十分に調整していない。
ProFHiTは,階層全体の予測分布を共同でモデル化する完全確率的階層予測モデルである。
論文 参考訳(メタデータ) (2022-06-16T06:13:53Z) - Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma
Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。
実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文 参考訳(メタデータ) (2021-11-11T14:28:12Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。