Fugu-MT 論文翻訳(概要): Deception Game: Closing the Safety-Learning Loop in Interactive Robot Autonomy

論文の概要: Deception Game: Closing the Safety-Learning Loop in Interactive Robot Autonomy

arxiv url: http://arxiv.org/abs/2309.01267v2
Date: Wed, 1 Nov 2023 19:01:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-03 16:56:50.685537
Title: Deception Game: Closing the Safety-Learning Loop in Interactive Robot Autonomy
Title（参考訳）: ディセプションゲーム:対話型ロボットオートノミーにおける安全学習ループの閉鎖
Authors: Haimin Hu, Zixu Zhang, Kensuke Nakamura, Andrea Bajcsy, Jaime F. Fisac
Abstract要約: 既存の安全手法は、ロボットが実行時に学習し適応する能力を無視することが多く、過度に保守的な行動を引き起こす。本稿では,ロボットの進化する不確実性を明示的に考慮した安全制御ポリシを合成するための,新しいクローズドループパラダイムを提案する。
参考スコア（独自算出の注目度）: 7.915956857741506
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: An outstanding challenge for the widespread deployment of robotic systems like autonomous vehicles is ensuring safe interaction with humans without sacrificing performance. Existing safety methods often neglect the robot's ability to learn and adapt at runtime, leading to overly conservative behavior. This paper proposes a new closed-loop paradigm for synthesizing safe control policies that explicitly account for the robot's evolving uncertainty and its ability to quickly respond to future scenarios as they arise, by jointly considering the physical dynamics and the robot's learning algorithm. We leverage adversarial reinforcement learning for tractable safety analysis under high-dimensional learning dynamics and demonstrate our framework's ability to work with both Bayesian belief propagation and implicit learning through large pre-trained neural trajectory predictors.
Abstract（参考訳）: 自動運転車のようなロボットシステムを広く展開する上での課題は、パフォーマンスを犠牲にすることなく、人間との安全なインタラクションを保証することだ。既存の安全手法は、ロボットが実行時に学習し適応する能力を無視することが多く、過度に保守的な行動を引き起こす。本稿では,ロボットの物理的ダイナミクスと学習アルゴリズムを協調的に考慮し,ロボットの進化する不確実性と,それに伴う将来のシナリオに迅速に対応できる能力を明確に説明し,安全な制御ポリシーを合成するための新しいクローズドループパラダイムを提案する。本研究では,高次元学習力学下でのトラクタブル・セーフティ解析に対向的強化学習を活用し,ベイズ的信念の伝播と暗黙的学習の両能力を示す。

関連論文リスト

Uncertainty Aware-Predictive Control Barrier Functions: Safer Human Robot Interaction through Probabilistic Motion Forecasting [13.020006323600251]
不確かさを意識した予測制御バリア関数は、制御バリア関数の正式な安全性を保証することで、確率的手の動き予測を融合させる。 UA-PCBFは、将来の人間の状態をより深く理解した協力型ロボットに力を与える。最先端のHRIアーキテクチャとは対照的に、UA-PCBFはタスククリティカルなメトリクスでより良いパフォーマンスを示す。
論文参考訳（メタデータ） (2025-08-28T14:11:26Z)
Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning [0.0]
本稿では,ロボットのさまざまなエージェントや障害物との相互作用を高める新しい手法を提案する。このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを保証する。本研究では,大人,自転車乗り,子供,静的障害物など,さまざまな物体との衝突に対してロボットをペナルティ化する新たな報酬関数を提案する。
論文参考訳（メタデータ） (2024-08-26T11:16:03Z)
Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文参考訳（メタデータ） (2024-07-02T21:00:30Z)
ABNet: Attention BarrierNet for Safe and Scalable Robot Learning [58.4951884593569]
バリアベースの手法は、安全なロボット学習における主要なアプローチの1つである。本稿では,より大規模な基本安全モデルを段階的に構築するスケーラブルなAttention BarrierNet(ABNet)を提案する。 2次元ロボット障害物回避、安全なロボット操作、視覚に基づくエンドツーエンド自動運転におけるABNetの強みを実証する。
論文参考訳（メタデータ） (2024-06-18T19:37:44Z)
Safe Reinforcement Learning on the Constraint Manifold: Theory and Applications [21.98309272057848]
本稿では,学習に基づくロボットシステムに対して,複雑な安全制約を原則的に課す方法について述べる。我々のアプローチは、安全ロボット構成の集合を表すConstraint Manifoldの概念に基づいている。実世界のロボットエアホッケータスクにおいて,本手法の有効性を実証する。
論文参考訳（メタデータ） (2024-04-13T20:55:15Z)
Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文参考訳（メタデータ） (2023-08-30T17:59:05Z)
Bridging Active Exploration and Uncertainty-Aware Deployment Using Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文参考訳（メタデータ） (2023-05-20T17:20:12Z)
Safe reinforcement learning of dynamic high-dimensional robotic tasks: navigation, manipulation, interaction [31.553783147007177]
強化学習では、損傷を起こさない環境を探索する上で、安全はより基本的なものである。本稿では,各種ロボット作業の強化学習のための安全探索の新たな定式化について紹介する。我々のアプローチは、幅広い種類のロボットプラットフォームに適用され、データから学んだ複雑な衝突制約の下でも安全を強制する。
論文参考訳（メタデータ） (2022-09-27T11:23:49Z)
Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文参考訳（メタデータ） (2022-04-15T08:12:15Z)
Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文参考訳（メタデータ） (2021-10-15T12:51:57Z)
Adversarial Training is Not Ready for Robot Learning [55.493354071227174]
対人訓練は,ノルム有界摂動に耐性のあるディープラーニングモデルを訓練する有効な方法である。敵訓練により得られたニューラルコントローラが3種類の欠陥を受けることを理論的および実験的に示す。この結果から, ロボット学習にはまだ対応できていないことが示唆された。
論文参考訳（メタデータ） (2021-03-15T07:51:31Z)
Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。 NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文参考訳（メタデータ） (2020-12-04T18:59:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。