論文の概要: Model-based Validation as Probabilistic Inference
- arxiv url: http://arxiv.org/abs/2305.09930v1
- Date: Wed, 17 May 2023 03:27:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 17:45:00.594465
- Title: Model-based Validation as Probabilistic Inference
- Title(参考訳): 確率的推論としてのモデルベース検証
- Authors: Harrison Delecki, Anthony Corso, Mykel J. Kochenderfer
- Abstract要約: 障害に対する分散を推定することは、自律システムを検証するための重要なステップである。
逐次システムの故障軌道上の分布をベイズ推定として推定する。
本手法は, 逆振子制御システム, 自律走行シナリオ, 部分的に観測可能な月面着陸機で実証された。
- 参考スコア(独自算出の注目度): 37.61747231296097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating the distribution over failures is a key step in validating
autonomous systems. Existing approaches focus on finding failures for a small
range of initial conditions or make restrictive assumptions about the
properties of the system under test. We frame estimating the distribution over
failure trajectories for sequential systems as Bayesian inference. Our
model-based approach represents the distribution over failure trajectories
using rollouts of system dynamics and computes trajectory gradients using
automatic differentiation. Our approach is demonstrated in an inverted pendulum
control system, an autonomous vehicle driving scenario, and a partially
observable lunar lander. Sampling is performed using an off-the-shelf
implementation of Hamiltonian Monte Carlo with multiple chains to capture
multimodality and gradient smoothing for safe trajectories. In all experiments,
we observed improvements in sample efficiency and parameter space coverage
compared to black-box baseline approaches. This work is open sourced.
- Abstract(参考訳): 障害の分布を見積もることは、自律システムを検証する上で重要なステップだ。
既存のアプローチでは、少数の初期条件に対する障害の発見や、テスト中のシステムの特性に関する限定的な仮定に重点を置いている。
逐次システムの故障軌道上の分布をベイズ推定として推定する。
モデルに基づくアプローチは,システムダイナミクスのロールアウトを用いた故障軌道上の分布を表現し,自動微分による軌道勾配の計算を行う。
本手法は, 逆振子制御システム, 自律走行シナリオ, 部分的に観測可能な月面着陸機で実証された。
複数の鎖を持つハミルトン・モンテカルロの既製の実装を用いてサンプリングを行い、安全な軌道に対して多モード性および勾配平滑化を捉える。
すべての実験において,ブラックボックスベースラインアプローチと比較して試料効率とパラメータ空間のカバレッジが向上した。
この作業はオープンソースである。
関連論文リスト
- On diffusion models for amortized inference: Benchmarking and improving
stochastic control and sampling [96.7808454149545]
本研究では,非正規化密度やエネルギー関数を持つ分布からサンプルを抽出する拡散モデルの訓練問題について検討する。
シミュレーションに基づく変分法や非政治手法など,拡散構造推論手法のベンチマークを行った。
我々の結果は、過去の研究の主張に疑問を投げかけながら、既存のアルゴリズムの相対的な利点を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-07T18:51:49Z) - Denoising Diffusion-Based Control of Nonlinear Systems [3.4530027457862]
本稿では,非線形力学系を制御するために,拡散確率モデル(DDPM)に基づく新しい手法を提案する。
DDPMは様々なサンプリングタスクで成功を収めた生成モデルの最先端技術である。
様々な非線形システムに対する我々のアプローチを数値的に研究し、理論的結果を検証する。
論文 参考訳(メタデータ) (2024-02-03T23:19:26Z) - Observation-Guided Diffusion Probabilistic Models [41.749374023639156]
観測誘導拡散確率モデル(OGDM)と呼ばれる新しい拡散に基づく画像生成法を提案する。
本手法は,観測プロセスの指導をマルコフ連鎖と統合することにより,トレーニング目標を再構築する。
本研究では,強力な拡散モデルベースライン上での多様な推論手法を用いたトレーニングアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2023-10-06T06:29:06Z) - Practical Probabilistic Model-based Deep Reinforcement Learning by
Integrating Dropout Uncertainty and Trajectory Sampling [7.179313063022576]
本稿では,ニューラルネットワーク上に構築された現在の確率モデルベース強化学習(MBRL)の予測安定性,予測精度,制御能力について述べる。
トラジェクトリサンプリング(DPETS)を用いた新しいアプローチであるドロップアウト型確率アンサンブルを提案する。
論文 参考訳(メタデータ) (2023-09-20T06:39:19Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Model Predictive Control with Gaussian-Process-Supported Dynamical
Constraints for Autonomous Vehicles [82.65261980827594]
本研究では、学習したガウス過程を利用して人間の運転行動を予測する自動運転車のモデル予測制御手法を提案する。
マルチモード予測制御アプローチは、人間のドライバーの意図を考察する。
論文 参考訳(メタデータ) (2023-03-08T17:14:57Z) - A Deep Reinforcement Learning Approach to Rare Event Estimation [30.670114229970526]
自律システムの設計における重要なステップは、失敗が起こる確率を評価することである。
安全クリティカルな領域では、モンテカルロサンプリングによる政策の評価が非効率であるように、失敗確率は非常に小さい。
逐次意思決定システムにおいて、稀な事象の確率を効率的に推定できる2つの適応的重要度サンプリングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-11-22T18:29:14Z) - Unrolling Particles: Unsupervised Learning of Sampling Distributions [102.72972137287728]
粒子フィルタリングは複素系の優れた非線形推定を計算するために用いられる。
粒子フィルタは様々なシナリオにおいて良好な推定値が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:58:34Z) - Certainty Equivalent Perception-Based Control [29.216967322052785]
動的に達成可能な高密度サンプリングスキームの下で,非カーネル回帰に拘束される一様誤差を示す。
これにより、経路追跡のためにクローズドループの回帰器を使用する場合の準最適性に対する有限時間収束率が得られる。
論文 参考訳(メタデータ) (2020-08-27T18:45:40Z) - Batch Stationary Distribution Estimation [98.18201132095066]
サンプル遷移の組を与えられたエルゴードマルコフ鎖の定常分布を近似する問題を考える。
与えられたデータに対する補正比関数の復元に基づく一貫した推定器を提案する。
論文 参考訳(メタデータ) (2020-03-02T09:10:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。