論文の概要: Approximate Inference for Stochastic Planning in Factored Spaces
- arxiv url: http://arxiv.org/abs/2203.12139v1
- Date: Wed, 23 Mar 2022 02:15:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 08:21:53.080843
- Title: Approximate Inference for Stochastic Planning in Factored Spaces
- Title(参考訳): 因子空間における確率計画の近似推定
- Authors: Zhennan Wu, Roni Khardon
- Abstract要約: 本稿では,離散因子空間の計画問題に対する解法として近似推論手法を用いる方法について検討する。
本稿では,先行作業の2次元,情報フローの方向,および使用する近似のタイプをキャプチャし,接続する,シンプルなフレームワークを提案する。
また,従来よりも厳密な変動近似を提供する新しいアルゴリズムCSVIを提案する。
- 参考スコア(独自算出の注目度): 6.467357887660512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The paper explores the use of approximate inference techniques as solution
methods for stochastic planning problems with discrete factored spaces. While
much prior work exists on this topic, subtle variations hinder a global
understanding of different approaches for their differences and potential
advantages. Here we abstract a simple framework that captures and connects
prior work along two dimensions, direction of information flow, i.e., forward
vs backward inference, and the type of approximation used, e.g., Belief
Propagation (BP) vs mean field variational inference (MFVI). Through this
analysis we also propose a novel algorithm, CSVI, which provides a tighter
variational approximation compared to prior work. An extensive experimental
evaluation compares algorithms from different branches of the framework,
showing that methods based on BP are generally better than methods based on
MFVI, that CSVI is competitive with BP algorithms, and that while inference
direction does not show a significant effect for VI methods, forward inference
provides stronger performance with BP.
- Abstract(参考訳): 本稿では,離散因子空間を用いた確率的計画問題の解法として近似推論手法を提案する。
このトピックに関する多くの先行研究があるが、微妙なバリエーションは、それらの違いと潜在的な利点に対する異なるアプローチのグローバルな理解を妨げる。
ここでは,情報フローの方向,すなわち前方方向と後方方向の推論,および,信念伝達(bp)と平均場変動推論(mfvi)といった近似のタイプを,2次元に沿ってキャプチャして接続する単純なフレームワークを抽象化する。
また,本解析により,先行研究に比べてより厳密な変分近似を行う新しいアルゴリズムcsviを提案する。
大規模な実験的評価では、BP に基づく手法は MFVI に基づく手法よりも一般的に優れていること、CSVI が BP のアルゴリズムと競合すること、推論方向が VI の手法に有意な影響を示さないこと、フォワード推論が BP でより優れた性能をもたらすこと、などである。
関連論文リスト
- A Trust-Region Method for Graphical Stein Variational Inference [3.5516599670943774]
スタイン変分法 (SVI) は、サンプル位置を情報理論尺度に共同最適化してサンプルセットを生成するサンプルベースの近似推論手法である。
本稿では,これらの課題に対処する新しい信頼条件付きアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-21T16:59:01Z) - Embedding Trajectory for Out-of-Distribution Detection in Mathematical Reasoning [50.84938730450622]
数理推論におけるOOD検出にトラジェクトリボラティリティを用いたトラジェクトリベースのTVスコアを提案する。
本手法は, 数学的推論シナリオ下でのGLM上での従来のアルゴリズムよりも優れる。
提案手法は,複数選択質問などの出力空間における高密度特徴を持つアプリケーションに拡張することができる。
論文 参考訳(メタデータ) (2024-05-22T22:22:25Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Variance-Preserving-Based Interpolation Diffusion Models for Speech
Enhancement [53.2171981279647]
本稿では,VP-および分散拡散(VE)に基づく拡散法の両方をカプセル化するフレームワークを提案する。
本研究では,拡散モデルで発生する一般的な困難を解析し,性能の向上とモデルトレーニングの容易化を図る。
我々は,提案手法の有効性を示すために,公開ベンチマークを用いたいくつかの手法によるモデルの評価を行った。
論文 参考訳(メタデータ) (2023-06-14T14:22:22Z) - A Rigorous Link between Deep Ensembles and (Variational) Bayesian
Methods [14.845158804951552]
ベイズ的,変分的ベイズ的,アンサンブル法の間の数学的に厳密な関係を確立した。
技術的なレベルでは、ワッサーシュタインフローのレンズを通して一般化された変分推論に寄与する。
論文 参考訳(メタデータ) (2023-05-24T11:13:59Z) - A step towards the applicability of algorithms based on invariant causal
learning on observational data [0.0]
本稿では、因果発見手法と効率よく統合された不変因果予測(ICP)を適用する方法について述べる。
また,本手法とICPを効果的に統合して因果発見を行う方法について述べる。
論文 参考訳(メタデータ) (2023-04-05T08:15:57Z) - On Representations of Mean-Field Variational Inference [2.4316550366482357]
平均場変動推論(MFVI)アルゴリズムを解析するためのフレームワークを提案する。
提案手法により,MFVI問題を3つの異なる方法で表現できる。
厳密な保証は、座標の漸進的変分推論アルゴリズムの時分割的な実装が限界の勾配フローをもたらすことを示すために確立される。
論文 参考訳(メタデータ) (2022-10-20T16:26:22Z) - Error-Aware Spatial Ensembles for Video Frame Interpolation [50.63021118973639]
近年,ビデオフレーム(VFI)アルゴリズムは,データ駆動アルゴリズムと実装の両面で前例のない進歩により,大幅に改善されている。
近年の研究では、挑戦的なVFIシナリオに対処する手段として、高度な動き推定や新しいワープ手法が導入されている。
本研究は、光フローとIEの相関関係を詳細に検討することにより、中間フレームを異なるIEレベルに対応する異なる領域に分割する新しいエラー予測指標を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:15:38Z) - Inverse Reinforcement Learning with Explicit Policy Estimates [19.159290496678004]
逆強化学習問題を解くための様々な手法が、機械学習と経済学において独立に開発された。
我々は、それらがすべて共通の形態の勾配、関連する政策と目的によって特徴づけられる最適化問題のクラスに属していることを示しています。
この最適化問題の研究から得られた知見を用いて,様々な問題シナリオを特定し,それらの問題に対する各手法の適合性について検討する。
論文 参考訳(メタデータ) (2021-03-04T07:00:58Z) - Semi-Supervised Learning with Variational Bayesian Inference and Maximum
Uncertainty Regularization [62.21716612888669]
半教師付き学習(SSL)を改善するための2つの一般的な方法を提案する。
第一に、重量摂動(WP)を既存のCR(Consistency regularization)ベースの手法に統合する。
第2の手法は「最大不確実性正規化(MUR)」と呼ばれる新しい整合性損失を提案する。
論文 参考訳(メタデータ) (2020-12-03T09:49:35Z) - Learning explanations that are hard to vary [75.30552491694066]
例を越えた平均化は、異なる戦略を縫合する記憶とパッチワークのソリューションに有利であることを示す。
そこで我々は論理ANDに基づく単純な代替アルゴリズムを提案し,実験的に検証する。
論文 参考訳(メタデータ) (2020-09-01T10:17:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。