論文の概要: Model-based Validation as Probabilistic Inference
- arxiv url: http://arxiv.org/abs/2305.09930v1
- Date: Wed, 17 May 2023 03:27:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 17:45:00.594465
- Title: Model-based Validation as Probabilistic Inference
- Title(参考訳): 確率的推論としてのモデルベース検証
- Authors: Harrison Delecki, Anthony Corso, Mykel J. Kochenderfer
- Abstract要約: 障害に対する分散を推定することは、自律システムを検証するための重要なステップである。
逐次システムの故障軌道上の分布をベイズ推定として推定する。
本手法は, 逆振子制御システム, 自律走行シナリオ, 部分的に観測可能な月面着陸機で実証された。
- 参考スコア(独自算出の注目度): 37.61747231296097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating the distribution over failures is a key step in validating
autonomous systems. Existing approaches focus on finding failures for a small
range of initial conditions or make restrictive assumptions about the
properties of the system under test. We frame estimating the distribution over
failure trajectories for sequential systems as Bayesian inference. Our
model-based approach represents the distribution over failure trajectories
using rollouts of system dynamics and computes trajectory gradients using
automatic differentiation. Our approach is demonstrated in an inverted pendulum
control system, an autonomous vehicle driving scenario, and a partially
observable lunar lander. Sampling is performed using an off-the-shelf
implementation of Hamiltonian Monte Carlo with multiple chains to capture
multimodality and gradient smoothing for safe trajectories. In all experiments,
we observed improvements in sample efficiency and parameter space coverage
compared to black-box baseline approaches. This work is open sourced.
- Abstract(参考訳): 障害の分布を見積もることは、自律システムを検証する上で重要なステップだ。
既存のアプローチでは、少数の初期条件に対する障害の発見や、テスト中のシステムの特性に関する限定的な仮定に重点を置いている。
逐次システムの故障軌道上の分布をベイズ推定として推定する。
モデルに基づくアプローチは,システムダイナミクスのロールアウトを用いた故障軌道上の分布を表現し,自動微分による軌道勾配の計算を行う。
本手法は, 逆振子制御システム, 自律走行シナリオ, 部分的に観測可能な月面着陸機で実証された。
複数の鎖を持つハミルトン・モンテカルロの既製の実装を用いてサンプリングを行い、安全な軌道に対して多モード性および勾配平滑化を捉える。
すべての実験において,ブラックボックスベースラインアプローチと比較して試料効率とパラメータ空間のカバレッジが向上した。
この作業はオープンソースである。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Diffusion-Based Failure Sampling for Cyber-Physical Systems [33.25641206808538]
本稿では,ロボットタスク計画のような複雑な高次元問題に成功している条件付き認知拡散モデルを提案する。
提案手法は高次元ロボット検証作業における有効性を示し,既存のブラックボックス技術と比較して試料効率とモードカバレッジを改善した。
論文 参考訳(メタデータ) (2024-06-20T22:22:28Z) - Amortizing intractable inference in diffusion models for vision, language, and control [89.65631572949702]
本稿では,p(mathbfx)$以前の拡散生成モデルとブラックボックス制約,あるいは関数$r(mathbfx)$からなるモデルにおいて,データ上の後部サンプルである $mathbfxsim prm post(mathbfx)propto p(mathbfx)r(mathbfx)$について検討する。
我々は,データフリー学習目標である相対軌道バランスの正しさを,サンプルから抽出した拡散モデルの訓練のために証明する。
論文 参考訳(メタデータ) (2024-05-31T16:18:46Z) - Denoising Diffusion-Based Control of Nonlinear Systems [3.4530027457862]
本稿では,非線形力学系を制御するために,拡散確率モデル(DDPM)に基づく新しい手法を提案する。
DDPMは様々なサンプリングタスクで成功を収めた生成モデルの最先端技術である。
様々な非線形システムに対する我々のアプローチを数値的に研究し、理論的結果を検証する。
論文 参考訳(メタデータ) (2024-02-03T23:19:26Z) - Observation-Guided Diffusion Probabilistic Models [41.749374023639156]
観測誘導拡散確率モデル(OGDM)と呼ばれる新しい拡散に基づく画像生成法を提案する。
本手法は,観測プロセスの指導をマルコフ連鎖と統合することにより,トレーニング目標を再構築する。
本研究では,強力な拡散モデルベースライン上での多様な推論手法を用いたトレーニングアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2023-10-06T06:29:06Z) - Practical Probabilistic Model-based Deep Reinforcement Learning by
Integrating Dropout Uncertainty and Trajectory Sampling [7.179313063022576]
本稿では,ニューラルネットワーク上に構築された現在の確率モデルベース強化学習(MBRL)の予測安定性,予測精度,制御能力について述べる。
トラジェクトリサンプリング(DPETS)を用いた新しいアプローチであるドロップアウト型確率アンサンブルを提案する。
論文 参考訳(メタデータ) (2023-09-20T06:39:19Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Unrolling Particles: Unsupervised Learning of Sampling Distributions [102.72972137287728]
粒子フィルタリングは複素系の優れた非線形推定を計算するために用いられる。
粒子フィルタは様々なシナリオにおいて良好な推定値が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:58:34Z) - Certainty Equivalent Perception-Based Control [29.216967322052785]
動的に達成可能な高密度サンプリングスキームの下で,非カーネル回帰に拘束される一様誤差を示す。
これにより、経路追跡のためにクローズドループの回帰器を使用する場合の準最適性に対する有限時間収束率が得られる。
論文 参考訳(メタデータ) (2020-08-27T18:45:40Z) - Batch Stationary Distribution Estimation [98.18201132095066]
サンプル遷移の組を与えられたエルゴードマルコフ鎖の定常分布を近似する問題を考える。
与えられたデータに対する補正比関数の復元に基づく一貫した推定器を提案する。
論文 参考訳(メタデータ) (2020-03-02T09:10:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。