論文の概要: Counter-example Guided Learning of Bounds on Environment Behavior
- arxiv url: http://arxiv.org/abs/2001.07233v3
- Date: Thu, 6 Feb 2020 06:19:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 05:47:58.630954
- Title: Counter-example Guided Learning of Bounds on Environment Behavior
- Title(参考訳): 環境行動における境界のカウンターサンプル学習
- Authors: Yuxiao Chen, Sumanth Dathathri, Tung Phan-Minh, and Richard M. Murray
- Abstract要約: 本稿では, 環境の正確なモデルなしで, 仕様適合性を評価可能なデータ駆動型ソリューションを提案する。
私たちのアプローチでは、データとシステムの望ましい振る舞いの仕様を使用して、環境の振る舞いの保守的な反応性境界を学習する。
- 参考スコア(独自算出の注目度): 11.357397596759172
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is a growing interest in building autonomous systems that interact with
complex environments. The difficulty associated with obtaining an accurate
model for such environments poses a challenge to the task of assessing and
guaranteeing the system's performance. We present a data-driven solution that
allows for a system to be evaluated for specification conformance without an
accurate model of the environment. Our approach involves learning a
conservative reactive bound of the environment's behavior using data and
specification of the system's desired behavior. First, the approach begins by
learning a conservative reactive bound on the environment's actions that
captures its possible behaviors with high probability. This bound is then used
to assist verification, and if the verification fails under this bound, the
algorithm returns counter-examples to show how failure occurs and then uses
these to refine the bound. We demonstrate the applicability of the approach
through two case-studies: i) verifying controllers for a toy multi-robot
system, and ii) verifying an instance of human-robot interaction during a
lane-change maneuver given real-world human driving data.
- Abstract(参考訳): 複雑な環境と対話する自律システムの構築に対する関心が高まっている。
このような環境の正確なモデルを得る際の困難さは、システムの性能を評価し保証するタスクに課題をもたらす。
本稿では,環境の正確なモデルを用いずに,仕様適合性を評価可能なデータ駆動型ソリューションを提案する。
提案手法では,システムの所望の動作をデータと仕様を用いて,環境の動作の保守的リアクティブ境界を学習する。
第一に、このアプローチは、環境の動作に保守的な反応境界を学習することから始まり、その可能な振る舞いを高い確率で捉える。
このバウンダリは検証を支援するために使用され、もしこのバウンダリの下で検証が失敗した場合、アルゴリズムは反例を返し、どのように障害が発生したかを示し、バウンダリを洗練するためにこれらを使用する。
2つのケーススタディを通じて,アプローチの適用性を示す。
一 おもちゃのマルチロボットシステムの制御装置の検証及び
二 実世界の人間の運転データに基づき、車線変更操作中の人間とロボットの相互作用の事例を検証すること。
関連論文リスト
- Data-driven Force Observer for Human-Robot Interaction with Series Elastic Actuators using Gaussian Processes [4.229902091180109]
本研究では,ガウス過程(GP)回帰を用いて未知の動的成分を学習する。
保証された推定誤差境界を導出し、安全クリティカルなアプリケーションでの使用を容易にする。
人-外骨格相互作用シナリオにおいて提案手法の有効性を実験的に示す。
論文 参考訳(メタデータ) (2024-05-14T15:51:52Z) - Evaluating Real-World Robot Manipulation Policies in Simulation [91.55267186958892]
実環境と模擬環境の制御と視覚的格差は、信頼性のある模擬評価の鍵となる課題である。
実環境に完全忠実なデジタル双生児を作らなくても、これらのギャップを軽減できる手法を提案する。
シミュレーション環境の集合体であるSIMPLERを作成した。
論文 参考訳(メタデータ) (2024-05-09T17:30:16Z) - Discovering Decision Manifolds to Assure Trusted Autonomous Systems [0.0]
本稿では,システムが提示できる正誤応答の範囲を最適化した探索手法を提案する。
この多様体は、従来のテストやモンテカルロシミュレーションよりもシステムの信頼性をより詳細に理解する。
この概念実証では,本手法を自動運転車のループ内ソフトウェア評価に適用する。
論文 参考訳(メタデータ) (2024-02-12T16:55:58Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Error-Aware Policy Learning: Zero-Shot Generalization in Partially
Observable Dynamic Environments [18.8481771211768]
新しい環境に適応できる政策を開発することで、このようなシム・トゥ・リアル問題に取り組むための新しいアプローチを紹介します。
私たちのアプローチの鍵は、トレーニング中に観察できない要因の影響を明示的に認識するエラー認識ポリシー(EAP)です。
ヒップトルク補助装置の訓練されたEAPは, 生体力学的特性の異なる異なる人体エージェントに転送可能であることを示す。
論文 参考訳(メタデータ) (2021-03-13T15:36:44Z) - Domain Curiosity: Learning Efficient Data Collection Strategies for
Domain Adaptation [16.539422751949797]
ドメインキュリオシティ — データの提供に明示的に最適化された探索的ポリシのトレーニング方法です。
ほとんどの好奇心のある方法とは対照的に、私たちのアプローチは学習に明示的に報いるため、環境騒音に対して堅牢です。
提案手法は,提案手法によって収集された環境動態について,モデルがどの程度学習できるかを比較することで評価する。
論文 参考訳(メタデータ) (2021-03-12T12:02:11Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。