論文の概要: A Safety-Critical Decision Making and Control Framework Combining
Machine Learning and Rule-based Algorithms
- arxiv url: http://arxiv.org/abs/2201.12819v1
- Date: Sun, 30 Jan 2022 13:58:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-02 06:35:46.170151
- Title: A Safety-Critical Decision Making and Control Framework Combining
Machine Learning and Rule-based Algorithms
- Title(参考訳): 機械学習とルールベースアルゴリズムを組み合わせた安全臨界意思決定・制御フレームワーク
- Authors: Andrei Aksjonov and Ville Kyrki
- Abstract要約: ルールベースの手法は安全クリティカルなシステムにおいて支配的だが、後者は複数の要件に対する堅牢性において第一の手法と競合することができない。
本稿では,ルールと機械学習の両手法の利点を生かした意思決定と制御の枠組みを提案する。
- 参考スコア(独自算出の注目度): 15.613795936398606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While artificial-intelligence-based methods suffer from lack of transparency,
rule-based methods dominate in safety-critical systems. Yet, the latter cannot
compete with the first ones in robustness to multiple requirements, for
instance, simultaneously addressing safety, comfort, and efficiency. Hence, to
benefit from both methods they must be joined in a single system. This paper
proposes a decision making and control framework, which profits from advantages
of both the rule- and machine-learning-based techniques while compensating for
their disadvantages. The proposed method embodies two controllers operating in
parallel, called Safety and Learned. A rule-based switching logic selects one
of the actions transmitted from both controllers. The Safety controller is
prioritized every time, when the Learned one does not meet the safety
constraint, and also directly participates in the safe Learned controller
training. Decision making and control in autonomous driving is chosen as the
system case study, where an autonomous vehicle learns a multi-task policy to
safely cross an unprotected intersection. Multiple requirements (i.e., safety,
efficiency, and comfort) are set for vehicle operation. A numerical simulation
is performed for the proposed framework validation, where its ability to
satisfy the requirements and robustness to changing environment is successfully
demonstrated.
- Abstract(参考訳): 人工知能に基づく手法は透明性の欠如に苦しむ一方で、ルールベースの手法は安全クリティカルなシステムにおいて支配的である。
しかし、後者は、安全性、快適性、効率性を同時に扱うなど、複数の要件に対する堅牢性において最初のものとは競合できない。
したがって、両方の方法の恩恵を受けるためには、1つのシステムで結合する必要がある。
本稿では,ルールベースと機械学習技術の両方の利点を享受し,その欠点を補う意思決定・制御フレームワークを提案する。
提案手法は,安全と学習という,並列動作する2つのコントローラを具体化する。
ルールベースのスイッチングロジックは、両方のコントローラから送信されるアクションの1つを選択する。
安全制御器は、学習した者が安全制約を満たさない場合、安全制御器の訓練に直接参加する場合、常に優先される。
自律運転における意思決定と制御は、自律走行車が安全で保護されていない交差点を横断するマルチタスクポリシーを学ぶシステムケーススタディとして選択される。
車両運用には複数の要件(安全、効率、快適など)が設定されている。
提案手法の有効性を検証し, 環境変化に対する要求条件とロバスト性を満たすための数値シミュレーションを行った。
関連論文リスト
- Dynamic Simplex: Balancing Safety and Performance in Autonomous Cyber
Physical Systems [1.3309898919316483]
本稿では,双方向スイッチングが可能なオンラインコントローラスイッチングロジックを用いたシンプルな戦略を提案する。
提案手法は, 現状技術よりも衝突が少なく, 性能も高いことを示す。
論文 参考訳(メタデータ) (2023-02-20T04:00:53Z) - Safety Correction from Baseline: Towards the Risk-aware Policy in
Robotics via Dual-agent Reinforcement Learning [64.11013095004786]
本稿では,ベースラインと安全エージェントからなる二重エージェント型安全強化学習戦略を提案する。
このような分離されたフレームワークは、RLベースの制御に対して高い柔軟性、データ効率、リスク認識を可能にする。
提案手法は,難易度の高いロボットの移動・操作作業において,最先端の安全RLアルゴリズムより優れる。
論文 参考訳(メタデータ) (2022-12-14T03:11:25Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Safe Pontryagin Differentiable Programming [17.63374326658473]
本稿では,安全クリティカルな学習・制御タスクの幅広いクラスを解決するための,理論的かつアルゴリズムによる安全な識別可能なフレームワークを提案する。
安全PDPの様々な安全学習・制御課題の解決能力を示す。
論文 参考訳(メタデータ) (2021-05-31T13:03:00Z) - Towards Safe Continuing Task Reinforcement Learning [21.390201009230246]
再起動を必要とせずに継続するタスク設定で動作可能なアルゴリズムを提案する。
本手法は,安全な探索を通じて安全な政策を学習する上で,提案手法の能力を示す数値例で評価する。
論文 参考訳(メタデータ) (2021-02-24T22:12:25Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Runtime-Safety-Guided Policy Repair [13.038017178545728]
安全クリティカルな環境下での学習型制御政策におけるポリシー修復の問題点について検討する。
本稿では,安全コントローラが作成したランタイムデータに基づいて,トレーニング済みポリシーを修復することで,制御スイッチングを低減あるいは排除することを提案する。
論文 参考訳(メタデータ) (2020-08-17T23:31:48Z) - Safe Reinforcement Learning via Curriculum Induction [94.67835258431202]
安全クリティカルなアプリケーションでは、自律エージェントはミスが非常にコストがかかる環境で学ぶ必要がある。
既存の安全な強化学習手法は、エージェントが危険な状況を避けるために、事前にエージェントを頼りにしている。
本稿では,エージェントが自動インストラクターの指導の下で学習する,人間の指導にインスパイアされた代替手法を提案する。
論文 参考訳(メタデータ) (2020-06-22T10:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。