論文の概要: Guaranteed Bounds for Posterior Inference in Universal Probabilistic
Programming
- arxiv url: http://arxiv.org/abs/2204.02948v1
- Date: Wed, 6 Apr 2022 17:28:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-07 16:23:36.549006
- Title: Guaranteed Bounds for Posterior Inference in Universal Probabilistic
Programming
- Title(参考訳): 普遍確率計画における後進推論の保証境界
- Authors: Raven Beutner, Luke Ong, Fabian Zaiser
- Abstract要約: 我々は、与えられたプログラムの実際の後部が下界と上界(音性)の間に挟まれていることを証明する。
本稿では,リターン値だけでなく,プログラム実行の重みにも自動的に間隔境界を推定する重み対応区間型システムを提案する。
文献からの例による評価では, 境界は有用であり, 後部推論法による誤った出力の認識にも有効であることが示された。
- 参考スコア(独自算出の注目度): 4.297070083645049
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a new method to approximate the posterior distribution of
probabilistic programs by means of computing guaranteed bounds. The starting
point of our work is an interval-based trace semantics for a recursive,
higher-order probabilistic programming language with continuous distributions.
Taking the form of (super-/subadditive) measures, these lower/upper bounds are
non-stochastic and provably correct: using the semantics, we prove that the
actual posterior of a given program is sandwiched between the lower and upper
bounds (soundness); moreover the bounds converge to the posterior
(completeness). As a practical and sound approximation, we introduce a
weight-aware interval type system, which automatically infers interval bounds
on not just the return value but also weight of program executions,
simultaneously. We have built a tool implementation, called GuBPI, which
automatically computes these posterior lower/upper bounds. Our evaluation on
examples from the literature shows that the bounds are useful, and can even be
used to recognise wrong outputs from stochastic posterior inference procedures.
- Abstract(参考訳): 本稿では,保証境界の計算により確率プログラムの後方分布を近似する新しい手法を提案する。
我々の研究の出発点は、連続分布を持つ再帰的で高階確率的プログラミング言語のための区間ベースのトレースセマンティクスである。
超加法(super-/subadditive)測度の形をとると、これらの下/上限境界は非確率的かつ証明可能な正則である: 意味論を用いて、与えられたプログラムの実際の後端が下限と上限(音性)の間に挟まれていることを証明する。
実用的かつ健全な近似として,戻り値だけでなくプログラム実行の重みにも自動的に間隔境界を推定する重み対応区間型システムを導入する。
我々はGuBPIと呼ばれるツール実装を構築し、これらの後部下/上境界を自動的に計算する。
文献の例に対する評価から, 境界は有用であり, 確率的後進推定法からの誤った出力を認識するのにも利用できることがわかった。
関連論文リスト
- Almost-sure convergence of iterates and multipliers in stochastic
sequential quadratic optimization [21.022322975077653]
等式制約付き連続最適化問題の解法が近年注目されている。
収束保証は、ゼロを測定するための勾配の期待値に制限されている。
また,SQPアルゴリズムにより生成した予備値,ラグランジュ測度,ステーション測度に対する新たなほぼ収束保証を証明した。
論文 参考訳(メタデータ) (2023-08-07T16:03:40Z) - The Stochastic Proximal Distance Algorithm [5.3315823983402755]
本稿では,所望の制約付き推定問題をペナルティパラメータとして回復する反復最適化手法のクラスを提案し,解析する。
我々は、最近の理論装置を拡張して有限誤差境界を確立し、収束率の完全な評価を行う。
また,本手法が一般的な学習課題のバッチバージョンより優れていることを示す。
論文 参考訳(メタデータ) (2022-10-21T22:07:28Z) - A lower confidence sequence for the changing mean of non-negative right
heavy-tailed observations with bounded mean [9.289846887298854]
信頼シーケンスは、時間パラメトリックカバレッジ保証付き予測可能なパラメータシーケンスに対する適応されたセット列を生成する。
この研究は、スラックが0に収束するランニング平均条件付き期待値に対して、漸近的でない低CSを構成する。
論文 参考訳(メタデータ) (2022-10-20T09:50:05Z) - Foundation Posteriors for Approximate Probabilistic Inference [11.64841553345271]
我々は確率的プログラムにおいて、推論をマスク付き言語モデリングとして定式化する。
ニューラルネットワークをトレーニングしてランダムな値を解き放ち、近似した後続分布を定義する。
提案手法の有効性をSTANプログラムのベンチマークで示す。
論文 参考訳(メタデータ) (2022-05-19T17:42:37Z) - Hessian Averaging in Stochastic Newton Methods Achieves Superlinear
Convergence [69.65563161962245]
ニュートン法を用いて,滑らかで強凸な目的関数を考える。
最適段階において局所収束に遷移する普遍重み付き平均化スキームが存在することを示す。
論文 参考訳(メタデータ) (2022-04-20T07:14:21Z) - Robust and Adaptive Temporal-Difference Learning Using An Ensemble of
Gaussian Processes [70.80716221080118]
本稿では、時間差学習(TD)による政策評価の世代的視点について考察する。
OS-GPTDアプローチは、状態-逆ペアのシーケンスを観測することにより、与えられたポリシーの値関数を推定するために開発された。
1つの固定カーネルに関連する限られた表現性を緩和するために、GP前の重み付けアンサンブル(E)を用いて代替のスキームを生成する。
論文 参考訳(メタデータ) (2021-12-01T23:15:09Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z) - On the Almost Sure Convergence of Stochastic Gradient Descent in
Non-Convex Problems [75.58134963501094]
本稿では,勾配降下(SGD)の軌跡を解析する。
我々はSGDが厳格なステップサイズポリシーのために1ドルでサドルポイント/マニフォールドを避けることを示す。
論文 参考訳(メタデータ) (2020-06-19T14:11:26Z) - A Distributional Analysis of Sampling-Based Reinforcement Learning
Algorithms [67.67377846416106]
定常ステップサイズに対する強化学習アルゴリズムの理論解析に対する分布的アプローチを提案する。
本稿では,TD($lambda$)や$Q$-Learningのような値ベースの手法が,関数の分布空間で制約のある更新ルールを持つことを示す。
論文 参考訳(メタデータ) (2020-03-27T05:13:29Z) - Regret and Belief Complexity Trade-off in Gaussian Process Bandits via
Information Thresholding [42.669970064867556]
GPバンディットアルゴリズムの残差境界と後部分布の複雑さのトレードオフを特徴付ける方法を示す。
大域的最適化に応用したGPバンディットアルゴリズムの精度と複雑性のトレードオフを観察する。
論文 参考訳(メタデータ) (2020-03-23T21:05:15Z) - Lagrangian Decomposition for Neural Network Verification [148.0448557991349]
ニューラルネットワーク検証の基本的なコンポーネントは、出力が取ることのできる値のバウンダリの計算である。
ラグランジアン分解に基づく新しい手法を提案する。
ランニングタイムのごく一部で、既成の解法に匹敵するバウンダリが得られることを示す。
論文 参考訳(メタデータ) (2020-02-24T17:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。