論文の概要: What type of inference is planning?
- arxiv url: http://arxiv.org/abs/2406.17863v3
- Date: Fri, 01 Nov 2024 23:12:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 21:26:40.949917
- Title: What type of inference is planning?
- Title(参考訳): どのような推論が計画されているのか?
- Authors: Miguel Lázaro-Gredilla, Li Yang Ku, Kevin P. Murphy, Dileep George,
- Abstract要約: すべての一般的な推論は、変分問題におけるエントロピー項の異なる重み付けに対応し、計画はちょうど異なる重みの集合に対応することを示す。
指数関数的に大きな状態空間によって引き起こされる誘引性を伴わずに、分解状態マルコフ決定過程において近似的な計画を実行することができるループ的信念伝播の類推を開発する。
- 参考スコア(独自算出の注目度): 6.65153939570213
- License:
- Abstract: Multiple types of inference are available for probabilistic graphical models, e.g., marginal, maximum-a-posteriori, and even marginal maximum-a-posteriori. Which one do researchers mean when they talk about ``planning as inference''? There is no consistency in the literature, different types are used, and their ability to do planning is further entangled with specific approximations or additional constraints. In this work we use the variational framework to show that, just like all commonly used types of inference correspond to different weightings of the entropy terms in the variational problem, planning corresponds exactly to a different set of weights. This means that all the tricks of variational inference are readily applicable to planning. We develop an analogue of loopy belief propagation that allows us to perform approximate planning in factored-state Markov decisions processes without incurring intractability due to the exponentially large state space. The variational perspective shows that the previous types of inference for planning are only adequate in environments with low stochasticity, and allows us to characterize each type by its own merits, disentangling the type of inference from the additional approximations that its practical use requires. We validate these results empirically on synthetic MDPs and tasks posed in the International Planning Competition.
- Abstract(参考訳): 複数のタイプの推論が確率的グラフィカルモデル(例えば、縁的、最大的、最大的、最大的、最大的、最小的といった)で利用可能である。
推論として計画する'と言うとき、研究者は何を意味するのだろうか?
文献には一貫性がなく、異なる型が使用され、計画を行う能力は特定の近似や追加の制約にさらに絡まっています。
この研究において、変分フレームワークを用いて、すべての一般的な推論の型が変分問題におけるエントロピー項の異なる重み付けに対応するのと同じように、計画がちょうど異なる重みの集合に対応することを示す。
これは、変分推論のすべてのトリックが計画に容易に適用できることを意味する。
我々は,指数関数的に大きい状態空間によって引き起こされる引き起こしを伴わずに,因子状態マルコフ決定過程において近似的な計画を実行することができるループ的信念伝播の類似体を開発する。
変動的な視点から,従来の計画の推論は,確率性の低い環境においてのみ適切であることが示され,各型をそれぞれのメリットによって特徴付けることができ,その実用性が要求される追加の近似から推論の型を遠ざけることができる。
本研究は,国際計画コンペティションにおける総合MDPと課題を実証的に検証する。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - PAVI: Plate-Amortized Variational Inference [55.975832957404556]
数百人の被験者のコホート上で何百万もの計測が行われる大集団研究において、推論は困難である。
この大きな濃度は、オフザシェルフ変分推論(VI)を計算的に非現実的である。
本研究では,大集団研究に効率よく取り組む構造VIファミリーを設計する。
論文 参考訳(メタデータ) (2023-08-30T13:22:20Z) - $\omega$PAP Spaces: Reasoning Denotationally About Higher-Order,
Recursive Probabilistic and Differentiable Programs [64.25762042361839]
$omega$PAP 空間は表現的微分可能および確率的プログラミング言語についての推論のための空間である。
我々の意味論は、最も実践的な確率的で微分可能なプログラムに意味を割り当てるのに十分である。
確率プログラムのトレース密度関数のほぼすべての微分可能性を確立する。
論文 参考訳(メタデータ) (2023-02-21T12:50:05Z) - Understanding Approximation for Bayesian Inference in Neural Networks [7.081604594416339]
ベイズニューラルネットワークにおける近似推論について検討する。
近似後部の期待効用は推論品質を測定することができる。
継続的かつ活発な学習セットは、後部品質とは無関係な課題を引き起こします。
論文 参考訳(メタデータ) (2022-11-11T11:31:13Z) - Counterfactual inference for sequential experiments [17.817769460838665]
複数の単位に複数の時間点に対する処理を割り当てるシーケンシャルな設計実験のアフタースタディ統計的推測を考察する。
我々のゴールは、最小限のスケールで、カウンターファクト平均に対する推論保証を提供することです。
我々は,いくつかのシミュレーションと,モバイル医療臨床試験HeartStepsのデータを含むケーススタディを通して,我々の理論を解説する。
論文 参考訳(メタデータ) (2022-02-14T17:24:27Z) - Variational Causal Networks: Approximate Bayesian Inference over Causal
Structures [132.74509389517203]
離散DAG空間上の自己回帰分布をモデル化したパラメトリック変分族を導入する。
実験では,提案した変分後部が真の後部を良好に近似できることを示した。
論文 参考訳(メタデータ) (2021-06-14T17:52:49Z) - Adaptive Belief Discretization for POMDP Planning [7.508023795800546]
多くのPOMDPソルバは、信念空間を均一に識別し、(一般に不明な)カバー数の観点から計画誤差を与える。
適応的信念の識別方式を提案し,それに関連する計画誤差を与える。
私達は私達のアルゴリズムがさまざまなシナリオの最先端の技術と競争が高いことを証明します。
論文 参考訳(メタデータ) (2021-04-15T07:04:32Z) - Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation [38.30703975408238]
視覚的関係はしばしば意味的に曖昧である。
あいまいさは自然に、複雑なマルチラベルの問題を引き起こし、多様な予測の必要性を動機付けます。
本研究では,プラグアンドプレイ確率不確実性モデリング(PUM)モジュールを提案する。
論文 参考訳(メタデータ) (2021-03-09T07:36:09Z) - Causal Expectation-Maximisation [70.45873402967297]
ポリツリーグラフを特徴とするモデルにおいても因果推論はNPハードであることを示す。
我々は因果EMアルゴリズムを導入し、分類的表現変数のデータから潜伏変数の不確かさを再構築する。
我々は、反事実境界が構造方程式の知識なしにしばしば計算できるというトレンドのアイデアには、目立たずの制限があるように思える。
論文 参考訳(メタデータ) (2020-11-04T10:25:13Z) - Causal Discovery in Physical Systems from Videos [123.79211190669821]
因果発見は人間の認知の中心にある。
本研究では,ビデオの因果発見の課題を,地層構造を監督せずにエンドツーエンドで検討する。
論文 参考訳(メタデータ) (2020-07-01T17:29:57Z) - Convex Parameter Recovery for Interacting Marked Processes [9.578874709168561]
ある場所で発生した事象の確率は、この場所や他の場所での過去の出来事に影響される可能性がある。
私たちは、一般的に採用されているため、相互作用が正あるいは崩壊することを制限しません。
本モデルでは,モデルパラメータに対する一般凸制約を許容することにより,事前知識を組み込む。
論文 参考訳(メタデータ) (2020-03-29T03:23:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。