論文の概要: Expected Information Maximization: Using the I-Projection for Mixture
Density Estimation
- arxiv url: http://arxiv.org/abs/2001.08682v1
- Date: Thu, 23 Jan 2020 17:24:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 12:38:59.334960
- Title: Expected Information Maximization: Using the I-Projection for Mixture
Density Estimation
- Title(参考訳): 予測情報最大化:i-射影を用いた混合密度推定
- Authors: Philipp Becker, Oleg Arenz, Gerhard Neumann
- Abstract要約: 高度にマルチモーダルなデータのモデリングは、機械学習において難しい問題である。
我々は,予測情報最大化(EIM)と呼ばれる新しいアルゴリズムを提案する。
我々のアルゴリズムは最近のGANアプローチよりもI射影の計算に効果的であることを示す。
- 参考スコア(独自算出の注目度): 22.096148237257644
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modelling highly multi-modal data is a challenging problem in machine
learning. Most algorithms are based on maximizing the likelihood, which
corresponds to the M(oment)-projection of the data distribution to the model
distribution. The M-projection forces the model to average over modes it cannot
represent. In contrast, the I(information)-projection ignores such modes in the
data and concentrates on the modes the model can represent. Such behavior is
appealing whenever we deal with highly multi-modal data where modelling single
modes correctly is more important than covering all the modes. Despite this
advantage, the I-projection is rarely used in practice due to the lack of
algorithms that can efficiently optimize it based on data. In this work, we
present a new algorithm called Expected Information Maximization (EIM) for
computing the I-projection solely based on samples for general latent variable
models, where we focus on Gaussian mixtures models and Gaussian mixtures of
experts. Our approach applies a variational upper bound to the I-projection
objective which decomposes the original objective into single objectives for
each mixture component as well as for the coefficients, allowing an efficient
optimization. Similar to GANs, our approach employs discriminators but uses a
more stable optimization procedure, using a tight upper bound. We show that our
algorithm is much more effective in computing the I-projection than recent GAN
approaches and we illustrate the effectiveness of our approach for modelling
multi-modal behavior on two pedestrian and traffic prediction datasets.
- Abstract(参考訳): 高度にマルチモーダルなデータのモデリングは、機械学習において難しい問題である。
ほとんどのアルゴリズムは、モデル分布へのデータ分布のM(oment)投影に対応する可能性の最大化に基づいている。
M射影はモデルに表現できない平均的なモードを強制する。
対照的に、I(情報)投影はデータのそのようなモードを無視し、モデルが表現できるモードに集中する。
このような振る舞いは、シングルモードを正しくモデル化することがすべてのモードをカバーするよりも重要である、高度にマルチモーダルなデータを扱う場合にも魅力的です。
この利点にもかかわらず、i-プロジェクションはデータに基づいて効率的に最適化できるアルゴリズムがないため、実際にはほとんど使われない。
本研究では,一般潜在変数モデルのサンプルのみに基づいてI-射影を計算し,ガウス混合モデルとガウス混合に焦点をあてる新しいアルゴリズムである期待情報最大化(EIM)を提案する。
提案手法では,I-射影目標に対して,各混合成分および係数に対して,元の目的を単一目的に分解し,効率的な最適化を実現する。
gansと同様に、このアプローチは判別器を用いるが、より安定な最適化手順を用いて、強い上界を用いている。
提案アルゴリズムは,近年のGANアプローチよりもI射影の計算に有効であることを示し,歩行者と交通予測の2つのデータセット上でのマルチモーダルな振る舞いをモデル化する手法の有効性を示す。
関連論文リスト
- Decoding-Time Language Model Alignment with Multiple Objectives [116.42095026960598]
既存の手法は主に、1つの報酬関数に対してLMを最適化することに集中し、それらの適応性は様々な目的に制限される。
本稿では,予測の線形結合から次のトークンを出力する復号時間アルゴリズムである$textbfmulti-objective decoding (MOD)$を提案する。
提案手法は, 自然条件下であっても, 既存のアプローチが準最適であることを示すとともに, 提案手法の最適性を保証する。
論文 参考訳(メタデータ) (2024-06-27T02:46:30Z) - Towards Efficient Pareto Set Approximation via Mixture of Experts Based Model Fusion [53.33473557562837]
大規模深層ニューラルネットワークに対する多目的最適化問題を解くことは、損失ランドスケープの複雑さと高価な計算コストのために難しい課題である。
本稿では,専門家(MoE)をベースとしたモデル融合を用いて,この問題を実用的でスケーラブルに解決する手法を提案する。
特殊な単一タスクモデルの重みをまとめることで、MoEモジュールは複数の目的間のトレードオフを効果的に捉えることができる。
論文 参考訳(メタデータ) (2024-06-14T07:16:18Z) - Stable Training of Probabilistic Models Using the Leave-One-Out Maximum Log-Likelihood Objective [0.7373617024876725]
カーネル密度推定(KDE)に基づくモデルは、このタスクの一般的な選択であるが、密度の異なるデータ領域に適応できない。
適応的なKDEモデルを用いてこれを回避し、モデル内の各カーネルは個別の帯域幅を持つ。
最適化速度を確実に高速化するために改良された期待最大化アルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-10-05T14:08:42Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - Efficient Training of Energy-Based Models Using Jarzynski Equality [13.636994997309307]
エネルギーベースモデル(英: Energy-based model、EBM)は、統計物理学にインスパイアされた生成モデルである。
モデルパラメータに対する勾配の計算には、モデルの分布をサンプリングする必要がある。
ここでは、ジャジンスキーの等式に基づく非平衡熱力学の結果を用いて、この計算を効率的に行う方法を示す。
論文 参考訳(メタデータ) (2023-05-30T21:07:52Z) - A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0]
我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文 参考訳(メタデータ) (2023-02-06T23:34:51Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Learning Distributionally Robust Models at Scale via Composite
Optimization [45.47760229170775]
DROの異なる変種が、スケーラブルな方法を提供する有限サム合成最適化の単なる例であることを示す。
また、非常に大規模なデータセットからロバストなモデルを学ぶために、先行技術に関して提案アルゴリズムの有効性を示す実験結果も提供する。
論文 参考訳(メタデータ) (2022-03-17T20:47:42Z) - Model-Agnostic Multitask Fine-tuning for Few-shot Vision-Language
Transfer Learning [59.38343286807997]
未知タスクの視覚言語モデルのためのモデル非依存型マルチタスクファインチューニング(MAMF)を提案する。
モデルに依存しないメタラーニング(MAML)と比較して、MAMFは二段階最適化を捨て、一階勾配のみを使用する。
MAMFは5つのベンチマークデータセット上で、数ショットの転送学習において古典的な微調整法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-03-09T17:26:53Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - Variational Model-based Policy Optimization [34.80171122943031]
モデルベース強化学習(RL)アルゴリズムにより、実システムとの相互作用から得られたデータとモデル生成データを組み合わせ、RLにおけるデータ効率問題を緩和する。
本稿では,ログライクリフのログライクリフの変動的下界としての目的関数を提案し,モデルとポリシーを共同で学習し,改善する。
多くの連続制御タスクに関する実験により、モデルベース(Eステップ)アルゴリズムはより複雑であるにもかかわらず、浮動小数点数モデルベースポリシー最適化(VMBPO)と呼ばれるアルゴリズムの方がよりサンプリング効率が高いことが示された。
論文 参考訳(メタデータ) (2020-06-09T18:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。