論文の概要: Moreau-Yosida $f$-divergences
- arxiv url: http://arxiv.org/abs/2102.13416v1
- Date: Fri, 26 Feb 2021 11:46:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-01 13:55:43.453639
- Title: Moreau-Yosida $f$-divergences
- Title(参考訳): Moreau-Yosida $f$-divergences
- Authors: D\'avid Terj\'ek
- Abstract要約: $f$-divergencesの変分表現は多くの機械学習アルゴリズムの中心である。
我々は、Kullback-Leibler, reverse Kullback-Leibler, $chi2$, reverse $chi2$, squared Hellinger, Jensen-Shannon, Jeffreys, triangular discrimination and total variation divergencesの変分式の実装を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variational representations of $f$-divergences are central to many machine
learning algorithms, with Lipschitz constrained variants recently gaining
attention. Inspired by this, we generalize the so-called tight variational
representation of $f$-divergences in the case of probability measures on
compact metric spaces to be taken over the space of Lipschitz functions
vanishing at an arbitrary base point, characterize functions achieving the
supremum in the variational representation, propose a practical algorithm to
calculate the tight convex conjugate of $f$-divergences compatible with
automatic differentiation frameworks, define the Moreau-Yosida approximation of
$f$-divergences with respect to the Wasserstein-$1$ metric, and derive the
corresponding variational formulas, providing a generalization of a number of
recent results, novel special cases of interest and a relaxation of the hard
Lipschitz constraint. As an application of our theoretical results, we propose
the Moreau-Yosida $f$-GAN, providing an implementation of the variational
formulas for the Kullback-Leibler, reverse Kullback-Leibler, $\chi^2$, reverse
$\chi^2$, squared Hellinger, Jensen-Shannon, Jeffreys, triangular
discrimination and total variation divergences as GANs trained on CIFAR-10,
leading to competitive results and a simple solution to the problem of
uniqueness of the optimal critic.
- Abstract(参考訳): $f$-divergencesの変分表現は多くの機械学習アルゴリズムの中心であり、Lipschitzは近年注目されている。
Inspired by this, we generalize the so-called tight variational representation of $f$-divergences in the case of probability measures on compact metric spaces to be taken over the space of Lipschitz functions vanishing at an arbitrary base point, characterize functions achieving the supremum in the variational representation, propose a practical algorithm to calculate the tight convex conjugate of $f$-divergences compatible with automatic differentiation frameworks, define the Moreau-Yosida approximation of $f$-divergences with respect to the Wasserstein-$1$ metric, and derive the corresponding variational formulas, providing a generalization of a number of recent results, novel special cases of interest and a relaxation of the hard Lipschitz constraint.
理論結果の応用として,Moreau-Yosida $f$-GANを提案し,Kullback-Leibler, reverse Kullback-Leibler, $\chi^2$, reverse $\chi^2$, squared Hellinger, Jensen-Shannon, Jeffreys, Triangular discrimination, total variations divergences as GANs training on CIFAR-10, 競争結果と最適評論者の独創性の問題に対する簡単な解決法を提案する。
- Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs [56.237917407785545]
本稿では,円滑なベルマン作用素を持つ連続空間マルコフ決定過程(MDP)の一般クラスにおいて,$varepsilon$-optimal Policyを学習する問題を考察する。
我々の結果は、連続空間 MDP における2つの人気と矛盾する視点のギャップを埋めるものである。
論文 参考訳(メタデータ) (2024-05-10T09:58:47Z) - A Mean-Field Analysis of Neural Stochastic Gradient Descent-Ascent for Functional Minimax Optimization [90.87444114491116]
i) 勾配降下指数アルゴリズムの収束と, (ii) ニューラルネットワークの表現学習に対処する。
論文 参考訳(メタデータ) (2024-04-18T16:46:08Z) - Combinatorial Stochastic-Greedy Bandit [79.1700188160944]
論文 参考訳(メタデータ) (2023-12-13T11:08:25Z) - Settling the Sample Complexity of Online Reinforcement Learning [92.02082223856479]
論文 参考訳(メタデータ) (2023-07-25T15:42:11Z) - Universal Online Learning with Gradient Variations: A Multi-layer Online Ensemble Approach [57.92727189589498]
我々は$mathcalO(log V_T)$, $mathcalO(d log V_T)$, $hatmathcalO(sqrtV_T)$ regret bounds for strong convex, exp-concave and convex loss function。
論文 参考訳(メタデータ) (2023-07-17T09:55:35Z) - Quantum Rényi and $f$-divergences from integral representations [11.74020933567308]
Smooth Csisz'ar $f$-divergences はいわゆるホッケースティックの発散に対する積分として表すことができる。
R'enyi の発散は、新しい量子 $f$-divergences によって定義されるが、一般には加法ではない。
論文 参考訳(メタデータ) (2023-06-21T15:39:38Z) - Multi-block-Single-probe Variance Reduced Estimator for Coupled
Compositional Optimization [49.58290066287418]
構成問題の複雑さを軽減するために,MSVR (Multi-block-probe Variance Reduced) という新しい手法を提案する。
本研究の結果は, 試料の複雑さの順序や強靭性への依存など, 様々な面で先行して改善された。
論文 参考訳(メタデータ) (2022-07-18T12:03:26Z) - $\alpha$-GAN: Convergence and Estimation Guarantees [7.493779672689531]
一般CPE損失関数 GAN の min-max 最適化と、関連する$f$-divergences の最小化との対応性を証明する。
次に、$alpha$-GAN を $alpha$-loss で定義し、いくつかの GAN を補間し、有元発散の最小化に対応する。
論文 参考訳(メタデータ) (2022-05-12T23:26:51Z) - Multiscale regression on unknown manifolds [13.752772802705978]
論文 参考訳(メタデータ) (2021-01-13T15:14:31Z) - Adaptive Online Estimation of Piecewise Polynomial Trends [23.91519151164528]
論文 参考訳(メタデータ) (2020-09-30T19:30:28Z) - Variational Representations and Neural Network Estimation of R\'enyi
Divergences [4.2896536463351]
確率測度 $Q$ と $P$ の間に R'enyi 族の発散式 $R_alpha(Q|P)$ を導出する。
論文 参考訳(メタデータ) (2020-07-07T22:34:30Z)