論文の概要: Positive Trust Balance for Self-Driving Car Deployment
- arxiv url: http://arxiv.org/abs/2009.05801v1
- Date: Sat, 12 Sep 2020 14:23:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 10:41:31.239728
- Title: Positive Trust Balance for Self-Driving Car Deployment
- Title(参考訳): 自動運転車展開における正の信頼バランス
- Authors: Philip Koopman, Michael Wagner
- Abstract要約: 自動運転車の展開準備が整った時期に関する決定は、遅れる指標データによって下される可能性が高い。
ポジティブトラストバランスアプローチは、責任あるデプロイメント決定に役立ちます。
- 参考スコア(独自算出の注目度): 3.106768467227812
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The crucial decision about when self-driving cars are ready to deploy is
likely to be made with insufficient lagging metric data to provide high
confidence in an acceptable safety outcome. A Positive Trust Balance approach
can help with making a responsible deployment decision despite this
uncertainty. With this approach, a reasonable initial expectation of safety is
based on a combination of a practicable amount of testing, engineering rigor,
safety culture, and a strong commitment to use post-deployment operational
feedback to further reduce uncertainty. This can enable faster deployment than
would be required by more traditional safety approaches by reducing the
confidence necessary at time of deployment in exchange for a more stringent
requirement for Safety Performance Indicator (SPI) field feedback in the
context of a strong safety culture.
- Abstract(参考訳): 自動運転車の配備準備がいつ可能かという重要な決定は、許容可能な安全性の成果に高い信頼性を提供するために、十分な遅延指標データでなされる可能性が高い。
ポジティブな信頼バランスアプローチは、この不確実性にもかかわらず、責任あるデプロイメント決定を行うのに役立つ。
このアプローチでは、適切な初期安全性の期待は、実践可能な量のテスト、エンジニアリング厳密さ、安全文化、そして不確実性をさらに軽減するためにデプロイ後の運用フィードバックを使用するという強いコミットメントの組み合わせに基づいている。
これにより、強力な安全文化のコンテキストにおいて、より厳格なSPI(Safety Performance Indicator)フィールドフィードバックの要求と引き換えに、デプロイメント時に必要となる信頼性を低減し、従来の安全アプローチよりも高速なデプロイメントが可能になる。
関連論文リスト
- Safeguarded Progress in Reinforcement Learning: Safe Bayesian
Exploration for Control Policy Synthesis [63.532413807686524]
本稿では、強化学習(RL)におけるトレーニング中の安全維持の問題に対処する。
探索中の効率的な進捗と安全性のトレードオフを扱う新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-12-18T16:09:43Z) - Searching for Optimal Runtime Assurance via Reachability and
Reinforcement Learning [2.422636931175853]
あるプラントのランタイム保証システム(RTA)は、バックアップコントローラで安全性を確保しながら、信頼できないまたは実験的なコントローラの運動を可能にする。
既存のRTA設計戦略は、過度に保守的であることで知られており、原則として、安全違反につながる可能性がある。
本稿では、最適RTA設計問題を定式化し、それを解決するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-10-06T14:45:57Z) - Safety Margins for Reinforcement Learning [74.13100479426424]
安全マージンを生成するためにプロキシ臨界度メトリクスをどのように活用するかを示す。
Atari 環境での APE-X と A3C からの学習方針に対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-07-25T16:49:54Z) - Did You Mean...? Confidence-based Trade-offs in Semantic Parsing [52.28988386710333]
タスク指向の構文解析において、キャリブレーションモデルが共通のトレードオフのバランスを取るのにどのように役立つかを示す。
次に、信頼性スコアがユーザビリティと安全性のトレードオフを最適化する上で、どのように役立つかを検証します。
論文 参考訳(メタデータ) (2023-03-29T17:07:26Z) - Optimal Transport Perturbations for Safe Reinforcement Learning with
Robustness Guarantees [9.742764207747697]
本稿では,最適な輸送コストの不確実性セットを用いて,ロバスト性を保証する安全な強化学習フレームワークを提案する。
実世界強化学習スイート(Real-World Reinforcement Learning Suite)において、安全性に制約のあるさまざまな継続的制御タスクに対する、我々のアプローチの堅牢で安全なパフォーマンスを実証する。
論文 参考訳(メタデータ) (2023-01-31T02:39:52Z) - ISAACS: Iterative Soft Adversarial Actor-Critic for Safety [1.290382979353427]
この研究は、ロボットシステムのための堅牢な安全維持コントローラのスケーラブルな合成を可能にする新しいアプローチを導入する。
安全を追求するフォールバックポリシーは、モデルエラーの最悪のケースの実現を促進するために、敵の「混乱」エージェントと共同で訓練される。
学習した制御ポリシーは本質的に安全性を保証するものではないが、リアルタイムの安全フィルタを構築するために使用される。
論文 参考訳(メタデータ) (2022-12-06T18:53:34Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Safe Reinforcement Learning via Confidence-Based Filters [78.39359694273575]
我々は,標準的な強化学習技術を用いて学習した名目政策に対して,国家安全の制約を認定するための制御理論的アプローチを開発する。
我々は、正式な安全保証を提供し、我々のアプローチの有効性を実証的に実証する。
論文 参考訳(メタデータ) (2022-07-04T11:43:23Z) - PixMix: Dreamlike Pictures Comprehensively Improve Safety Measures [65.36234499099294]
フラクタルなどの画像の自然な構造的複雑さを利用した新しいデータ拡張戦略を提案する。
この課題に対処するために、フラクタルなどの画像の自然な構造的複雑さを利用した新しいデータ拡張戦略を設計する。
論文 参考訳(メタデータ) (2021-12-09T18:59:31Z) - Bootstrapping confidence in future safety based on past safe operation [0.0]
本研究は,運転初期における事故発生確率の低い信頼度へのアプローチを示す。
これにより、不運な運転が安全への自信を確証することを願って、限られた基準でシステムを操作するという一般的なアプローチが定式化される。
論文 参考訳(メタデータ) (2021-10-20T18:36:23Z) - Synthesizing Safe Policies under Probabilistic Constraints with
Reinforcement Learning and Bayesian Model Checking [4.797216015572358]
制約条件下での強化学習者の要求仕様作成のためのフレームワークを提案する。
本研究では,制約満足度に対するエージェントの信頼度が,学習過程における最適化と安全性のバランスをとる上で有用な信号であることを示す。
論文 参考訳(メタデータ) (2020-05-08T08:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。