論文の概要: Reducing Human-Robot Goal State Divergence with Environment Design
- arxiv url: http://arxiv.org/abs/2404.15184v1
- Date: Wed, 10 Apr 2024 20:36:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-28 11:16:37.561655
- Title: Reducing Human-Robot Goal State Divergence with Environment Design
- Title(参考訳): 環境設計による人間-ロボット目標状態の多様性の低減
- Authors: Kelsey Sikes, Sarah Keren, Sarath Sreedharan,
- Abstract要約: 人間とAIのコラボレーションを成功させる上で最も難しい課題の1つは、ロボットの振る舞いと人間のユーザの期待を一致させることである。
我々は,ロボットの最終目標状態と人間の期待する目標状態との差を表す,Goal State Divergence $mathcal(GSD)$と呼ばれる新しい指標を提案する。
- 参考スコア(独自算出の注目度): 23.98278690802828
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the most difficult challenges in creating successful human-AI collaborations is aligning a robot's behavior with a human user's expectations. When this fails to occur, a robot may misinterpret their specified goals, prompting it to perform actions with unanticipated, potentially dangerous side effects. To avoid this, we propose a new metric we call Goal State Divergence $\mathcal{(GSD)}$, which represents the difference between a robot's final goal state and the one a human user expected. In cases where $\mathcal{GSD}$ cannot be directly calculated, we show how it can be approximated using maximal and minimal bounds. We then input the $\mathcal{GSD}$ value into our novel human-robot goal alignment (HRGA) design problem, which identifies a minimal set of environment modifications that can prevent mismatches like this. To show the effectiveness of $\mathcal{GSD}$ for reducing differences between human-robot goal states, we empirically evaluate our approach on several standard benchmarks.
- Abstract(参考訳): 人間とAIのコラボレーションを成功させる上で最も難しい課題の1つは、ロボットの振る舞いと人間のユーザの期待を一致させることである。
これが起こらなかった場合、ロボットは指定された目標を誤って解釈し、予期しない、潜在的に危険な副作用で行動を起こす。
これを回避するため,Goal State Divergence $\mathcal{(GSD)}$と呼ばれる新しいメトリクスを提案する。
$\mathcal{GSD}$ が直接計算できない場合、極大および極小境界を用いてそれを近似する方法を示す。
次に、新しいヒューマンロボットゴールアライメント(HRGA)設計問題に$\mathcal{GSD}$値を入力する。
ロボットの目標状態の違いを減らすための$\mathcal{GSD}$の有効性を示すため,いくつかの標準ベンチマークにおいて,我々のアプローチを実証的に評価した。
関連論文リスト
- One-Shot Imitation under Mismatched Execution [7.060120660671016]
プロンプトとしての人間のデモは、ロボットに長距離操作のタスクをプログラムするための強力な方法だ。
これらのデモをロボット実行可能なアクションに変換することは、運動スタイルや身体能力のミスマッチの実行による重大な課題を呈する。
本稿では,人間とロボットのタスク実行を最適な輸送コストで自動調整する新しいフレームワークRHyMEを提案する。
論文 参考訳(メタデータ) (2024-09-10T16:11:57Z) - Quantifying Assistive Robustness Via the Natural-Adversarial Frontier [40.125563987538044]
RIGIDは、ロボット報酬の最小化と人間の行動とをトレードオフする対人政策の訓練方法である。
補助ギムタスクでは、RIGIDを用いて、標準的な協調強化学習のパフォーマンスを分析する。
また,フロンティアのRIGIDを,専門家の対人インタラクションで特定された障害と,ユーザインタラクション中に自然に発生する障害とを比較した。
論文 参考訳(メタデータ) (2023-10-16T17:34:54Z) - ImitationNet: Unsupervised Human-to-Robot Motion Retargeting via Shared Latent Space [9.806227900768926]
本稿では,ロボットの動きに対する新しいディープラーニング手法を提案する。
本手法では,新しいロボットへの翻訳を容易にする,人間とロボットのペアデータを必要としない。
我々のモデルは、効率と精度の観点から、人間とロボットの類似性に関する既存の研究よりも優れています。
論文 参考訳(メタデータ) (2023-09-11T08:55:04Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Robust Robot Planning for Human-Robot Collaboration [11.609195090422514]
人間とロボットのコラボレーションにおいて、人間の目的はしばしばロボットに未知である。
本研究では,各目的関数に対して不確実な人間行動(ポリシー)を自動的に生成する手法を提案する。
また,上記の不確実性に対して頑健なロボット計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T16:02:48Z) - Can Foundation Models Perform Zero-Shot Task Specification For Robot
Manipulation? [54.442692221567796]
タスク仕様は、熟練していないエンドユーザの関与とパーソナライズされたロボットの採用に不可欠である。
タスク仕様に対する広く研究されているアプローチは、目標を通じて、コンパクトな状態ベクトルまたは同じロボットシーンのゴールイメージを使用することである。
そこで本研究では,人間の指定や使用が容易な目標仕様の代替的,より汎用的な形式について検討する。
論文 参考訳(メタデータ) (2022-04-23T19:39:49Z) - Correcting Robot Plans with Natural Language Feedback [88.92824527743105]
ロボットの修正のための表現的かつ柔軟なツールとして自然言語を探索する。
これらの変換により、ユーザは目標を正し、ロボットの動きを更新し、計画上のエラーから回復できる。
本手法により,シミュレーション環境や実環境において,複数の制約を合成し,未知のシーン,オブジェクト,文に一般化することが可能となる。
論文 参考訳(メタデータ) (2022-04-11T15:22:43Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z) - Minimizing Robot Navigation-Graph For Position-Based Predictability By
Humans [20.13307800821161]
人間とロボットが同じ空間を移動しながら独自のタスクを遂行している状況では、予測可能な経路が不可欠である。
ロボットの数が増加するにつれて、人間がロボットの進路を予測するための認知的努力は不可能になる。
そこで本研究では,位置に基づく予測可能性のために,ロボットのナビゲーショングラフを最小化することを提案する。
論文 参考訳(メタデータ) (2020-10-28T22:09:10Z) - Joint Inference of States, Robot Knowledge, and Human (False-)Beliefs [90.20235972293801]
本稿では,人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)の認知能力が,ロボットとの相互作用にどのように影響するかを理解するために,対象状態,ロボット知識,人間(時間的)の認知能力の表現にグラフィカルモデルを採用することを提案する。
推論アルゴリズムは、複数のビューにまたがる全てのロボットから個別のpgを融合し、単一のビューから発生したエラーを克服するより効果的な推論能力を得る。
論文 参考訳(メタデータ) (2020-04-25T23:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。