論文の概要: On two ways to use determinantal point processes for Monte Carlo integration
- arxiv url: http://arxiv.org/abs/2604.19698v1
- Date: Tue, 21 Apr 2026 17:17:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.899457
- Title: On two ways to use determinantal point processes for Monte Carlo integration
- Title(参考訳): モンテカルロ積分における決定点過程の2つの方法について
- Authors: Guillaume Gautier, Rémi Bardenet, Michal Valko,
- Abstract要約: 独立サンプルをDPP (Determinantal point process) で置き換えることで、推定値が一貫したものになる。
1つはBardenet & Hardy (2020)で、$mathcalO(N- (1+1/d))$のスムーズな$f$に対して、固定されたDPPに依存する。
一方、Ermakov & Zolotukhin (1960) による DPP はモンテカルロのように1/N$の順序に偏っているが、その DPP は$f$ に調整されている。
- 参考スコア(独自算出の注目度): 17.879432703967055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The standard Monte Carlo estimator $\widehat{I}_N^{\mathrm{MC}}$ of $\int fdω$ relies on independent samples from $ω$ and has variance of order $1/N$. Replacing the samples with a determinantal point process (DPP), a repulsive distribution, makes the estimator consistent, with variance rates that depend on how the DPP is adapted to $f$ and $ω$. We examine two existing DPP-based estimators: one by Bardenet & Hardy (2020) with a rate of $\mathcal{O}(N^{-(1+1/d)})$ for smooth $f$, but relying on a fixed DPP. The other, by Ermakov & Zolotukhin (1960), is unbiased with rate of order $1/N$, like Monte Carlo, but its DPP is tailored to $f$. We revisit these estimators, generalize them to continuous settings, and provide sampling algorithms.
- Abstract(参考訳): 標準モンテカルロ推定器 $\widehat{I}_N^{\mathrm{MC}}$ of $\int fdω$ は$ω$ の独立したサンプルに依存し、次数 1/N$ の分散を持つ。
サンプルを反発分布である決定点過程(DPP)で置き換えると、DPPが$f$と$ω$にどのように適合するかに依存する分散率で、推定値が一貫する。
1つは Bardenet & Hardy (2020) による、スムーズな$f$に対して$\mathcal{O}(N^{-(1+1/d)} のレートを持つが、固定 DPP に依存する。
もう一つは Ermakov & Zolotukhin (1960) によるものであり、モンテカルロのように1/N$の順序に偏っているが、DPPは$f$に調整されている。
これらの推定器を再検討し、連続的な設定に一般化し、サンプリングアルゴリズムを提供する。
関連論文リスト
- Bypassing orthogonalization in the quantum DPP sampler [8.30255326875704]
我々は、Kerenidisらの形式にインスパイアされた単純な回路が、2022年に我々がアプリケーションで遭遇したことのないタイプのDPPをサンプリングしたことを示す。
第2のコントリビューションは振幅増幅を用いて、回路深さの価格で受け入れ確率を$a$から$1-a$に上げることである。
論文 参考訳(メタデータ) (2025-03-07T19:57:39Z) - Multiple-policy Evaluation via Density Estimation [30.914344538340412]
本稿では,この問題に対して$mathrmCAESAR$というアルゴリズムを提案する。
低次かつ対数的な$mathrmCAESAR$は、$tildeOleft(fracH4epsilon2sum_h=1Hmax_kin[K]sum_s,afrac(d_hpik(s,a))2mu*_h(s,a)right)$である。
論文 参考訳(メタデータ) (2024-03-29T23:55:25Z) - Stochastic Approximation Approaches to Group Distributionally Robust Optimization and Beyond [89.72693227960274]
本稿では,グループ分散ロバスト最適化 (GDRO) を,$m$以上の異なる分布をうまく処理するモデルを学習する目的で検討する。
各ラウンドのサンプル数を$m$から1に抑えるため、GDROを2人でプレイするゲームとして、一方のプレイヤーが実行し、他方のプレイヤーが非公開のマルチアームバンディットのオンラインアルゴリズムを実行する。
第2のシナリオでは、最大リスクではなく、平均的最上位k$リスクを最適化し、分散の影響を軽減することを提案する。
論文 参考訳(メタデータ) (2023-02-18T09:24:15Z) - OPORP: One Permutation + One Random Projection [37.6593006747285]
OPORPは、データ縮小/圧縮を達成するために、count-sketch'型のデータ構造の一種を使用する。
1つの重要なステップは、$k$サンプルを$l$標準に正規化することだ。
OPORPでは、(i)正規化と(ii)固定長ビンニングスキームの2つの重要なステップが、コサイン類似性を推定する精度を大幅に改善した。
論文 参考訳(メタデータ) (2023-02-07T14:45:34Z) - A Faster Sampler for Discrete Determinantal Point Processes [10.355938901584567]
Discrete Determinantal Point Processs (DPP) は、データセットのサブサンプル化に幅広い可能性を持つ。
最悪の場合、サンプリングコストは$O(n3)$で、nは基底集合の要素の数である。
この禁止コストに対する一般的な回避策は、低ランクカーネルによって定義されたDPPをサンプリングすることである。
論文 参考訳(メタデータ) (2022-10-31T14:37:54Z) - Reward-Mixing MDPs with a Few Latent Contexts are Learnable [75.17357040707347]
報酬混合マルコフ決定過程(RMMDP)におけるエピソード強化学習の検討
我々のゴールは、そのようなモデルにおける時間段階の累積報酬をほぼ最大化する、ほぼ最適に近いポリシーを学ぶことである。
論文 参考訳(メタデータ) (2022-10-05T22:52:00Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。