Fugu-MT 論文翻訳(概要): Adaptive Symmetrization of the KL Divergence

論文の概要: Adaptive Symmetrization of the KL Divergence

arxiv url: http://arxiv.org/abs/2511.11159v1
Date: Fri, 14 Nov 2025 10:41:59 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-17 22:42:18.542983
Title: Adaptive Symmetrization of the KL Divergence
Title（参考訳）: KL多様性の適応的対称性
Authors: Omri Ben-Dov, Luiz F. O. Chamon,
Abstract要約: 機械学習における多くのタスクは、有限個のサンプル集合が与えられた確率分布を学習するために記述または縮小することができる。一般的なアプローチは、(経験的)データ分布とパラメータ化された分布(例えば、正規化フロー(NF)やエネルギーベースモデル(EBM)との統計的分岐を最小化することである。
参考スコア（独自算出の注目度）: 10.632997610787207
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Many tasks in machine learning can be described as or reduced to learning a probability distribution given a finite set of samples. A common approach is to minimize a statistical divergence between the (empirical) data distribution and a parameterized distribution, e.g., a normalizing flow (NF) or an energy-based model (EBM). In this context, the forward KL divergence is a ubiquitous due to its tractability, though its asymmetry may prevent capturing some properties of the target distribution. Symmetric alternatives involve brittle min-max formulations and adversarial training (e.g., generative adversarial networks) or evaluating the reverse KL divergence, as is the case for the symmetric Jeffreys divergence, which is challenging to compute from samples. This work sets out to develop a new approach to minimize the Jeffreys divergence. To do so, it uses a proxy model whose goal is not only to fit the data, but also to assist in optimizing the Jeffreys divergence of the main model. This joint training task is formulated as a constrained optimization problem to obtain a practical algorithm that adapts the models priorities throughout training. We illustrate how this framework can be used to combine the advantages of NFs and EBMs in tasks such as density estimation, image generation, and simulation-based inference.
Abstract（参考訳）: 機械学習における多くのタスクは、有限個のサンプル集合が与えられた確率分布を学習するために記述または縮小することができる。一般的なアプローチは、(経験的)データ分布とパラメータ化された分布、例えば、正規化フロー(NF)またはエネルギーベースモデル(EBM)の間の統計的ばらつきを最小化することである。この文脈では、前方KLの発散はそのトラクタビリティのためユビキタスであるが、その非対称性は対象分布のいくつかの性質を捉えることを妨げうる。対称的な代替手段としては、不安定な min-max の定式化や、逆 KL の分岐を評価する逆 KL の分岐(サンプルから計算するのが難しい対称なジェフリーズ発散(英語版))がある。この研究は、ジェフリーズ発散を最小限に抑える新しいアプローチを開発することを目的としている。そのためには、データに適合するだけでなく、メインモデルのJeffreys分散の最適化を支援するプロキシモデルを使用する。この共同トレーニングタスクは制約付き最適化問題として定式化され、トレーニングを通してモデルの優先順位に適応する実用的なアルゴリズムを得る。本稿では,このフレームワークを用いて,密度推定や画像生成,シミュレーションに基づく推論といったタスクにおいて,NFとEMMの利点を組み合わせる方法について述べる。

関連論文リスト

Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
一般のスコアミスマッチ拡散サンプリング器に対する明示的な次元依存性を持つ最初の性能保証を示す。その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文参考訳（メタデータ） (2024-10-17T16:42:12Z)
Diffusion models for probabilistic programming [56.47577824219207]
拡散モデル変分推論(DMVI)は確率型プログラミング言語(PPL)における自動近似推論手法である DMVIは実装が容易で、例えば正規化フローを用いた変分推論の欠点を伴わずに、PPLでヘイズルフリー推論が可能であり、基礎となるニューラルネットワークモデルに制約を課さない。
論文参考訳（メタデータ） (2023-11-01T12:17:05Z)
Variational autoencoder with weighted samples for high-dimensional non-parametric adaptive importance sampling [0.0]
既存のフレームワークを、新しい目的関数を導入することで、重み付けされたサンプルの場合に拡張する。モデルに柔軟性を加え、マルチモーダル分布を学習できるようにするため、学習可能な事前分布を考える。提案手法は,既存の適応的重要度サンプリングアルゴリズムを用いて,目標分布から点を抽出し,高次元で稀な事象確率を推定する。
論文参考訳（メタデータ） (2023-10-13T15:40:55Z)
Adversarial Adaptive Sampling: Unify PINN and Optimal Transport for the Approximation of PDEs [2.526490864645154]
ニューラルネットワークモデルにより与えられた近似解とトレーニングセットのランダムサンプルを同時に最適化する新しいminmax式を提案する。鍵となる考え方は、深層生成モデルを用いてトレーニングセット内のランダムサンプルを調整し、近似されたPDE解によって誘導される残差が滑らかなプロファイルを維持することである。
論文参考訳（メタデータ） (2023-05-30T02:59:18Z)
Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文参考訳（メタデータ） (2022-04-13T12:43:12Z)
Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文参考訳（メタデータ） (2022-02-23T06:11:49Z)
Information Theoretic Structured Generative Modeling [13.117829542251188]
構造生成モデル (Structured Generative Model, SGM) と呼ばれる新しい生成モデルフレームワークが提案され, 簡単な最適化が可能となった。この実装では、無限のガウス混合モデルを学習するために適合した単一白色ノイズ源への正則入力によって駆動される1つのニューラルネットワークを採用している。予備的な結果は、SGMがデータ効率と分散、従来のガウス混合モデルと変分混合モデル、および敵ネットワークのトレーニングにおいてMINE推定を著しく改善することを示している。
論文参考訳（メタデータ） (2021-10-12T07:44:18Z)
KL Guided Domain Adaptation [88.19298405363452]
ドメイン適応は重要な問題であり、現実世界のアプリケーションにしばしば必要である。ドメイン適応文学における一般的なアプローチは、ソースとターゲットドメインに同じ分布を持つ入力の表現を学ぶことである。確率的表現ネットワークにより、KL項はミニバッチサンプルにより効率的に推定できることを示す。
論文参考訳（メタデータ） (2021-06-14T22:24:23Z)
Achieving Efficiency in Black Box Simulation of Distribution Tails with Self-structuring Importance Samplers [1.6114012813668934]
本稿では,線形プログラムや整数線形プログラム,ピースワイド線形・二次目的,ディープニューラルネットワークで指定された特徴マップなど,多種多様なツールでモデル化されたパフォーマンス指標の分布を推定する,新しいImportance Smpling(IS)方式を提案する。
論文参考訳（メタデータ） (2021-02-14T03:37:22Z)
Shaping Deep Feature Space towards Gaussian Mixture for Visual Classification [74.48695037007306]
視覚分類のためのディープニューラルネットワークのためのガウス混合損失関数(GM)を提案する。分類マージンと可能性正規化により、GM損失は高い分類性能と特徴分布の正確なモデリングの両方を促進する。提案したモデルは、追加のトレーニング可能なパラメータを使わずに、簡単かつ効率的に実装できる。
論文参考訳（メタデータ） (2020-11-18T03:32:27Z)
Variational Mixture of Normalizing Flows [0.0]
生成逆数ネットワークオートサイトGAN、変分オートエンコーダオートサイトベイペーパー、およびそれらの変種などの深い生成モデルは、複雑なデータ分布をモデル化するタスクに広く採用されている。正規化フローはこの制限を克服し、確率密度関数にそのような公式の変更を利用する。本研究は,混合モデルのコンポーネントとして正規化フローを用い,そのようなモデルのエンドツーエンドトレーニング手順を考案することによって,この問題を克服する。
論文参考訳（メタデータ） (2020-09-01T17:20:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。