論文の概要: Learning from Incremental Directional Corrections
- arxiv url: http://arxiv.org/abs/2011.15014v1
- Date: Mon, 30 Nov 2020 17:16:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 14:28:52.933206
- Title: Learning from Incremental Directional Corrections
- Title(参考訳): インクリメンタルな方向補正から学ぶ
- Authors: Wanxin Jin, Todd D. Murphey, Shaoshuai Mou
- Abstract要約: 本研究では,ロボットが人間の修正から制御対象関数を漸進的に学習することを可能にする手法を提案する。
人間の補正は、その大きさに関わらず、ロボットの現在の動きを改善する方向を指していると仮定する。
提案手法は, 修正方向を用いて, 切削面法に基づく目的関数の推定値の更新を行う。
- 参考スコア(独自算出の注目度): 9.45570271906093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a technique which enables a robot to learn a control
objective function incrementally from human user's corrections. The human's
corrections can be as simple as directional corrections -- corrections that
indicate the direction of a control change without indicating its magnitude --
applied at some time instances during the robot's motion. We only assume that
each of the human's corrections, regardless of its magnitude, points in a
direction that improves the robot's current motion relative to an implicit
objective function. The proposed method uses the direction of a correction to
update the estimate of the objective function based on a cutting plane
technique. We establish the theoretical results to show that this process of
incremental correction and update guarantees convergence of the learned
objective function to the implicit one. The method is validated by both
simulations and two human-robot games, where human players teach a 2-link robot
arm and a 6-DoF quadrotor system for motion planning in environments with
obstacles.
- Abstract(参考訳): 本稿では,ロボットが人間の修正から制御対象関数を段階的に学習できる手法を提案する。
人間の補正は、方向修正と同じくらい単純で、その大きさを示さずに制御の変化の方向を示す補正は、ロボットの動き中にある時点で適用される。
人間の修正は、その大きさに関係なく、暗黙の目的関数と比較してロボットの現在の動きを改善する方向を指していると仮定するのみである。
提案手法は,切削面法に基づく対象関数の推定値を更新するために補正の方向を用いる。
我々は,この漸進的修正と更新のプロセスが学習対象関数の暗黙的関数への収束を保証することを示す理論的結果を確立する。
この方法はシミュレーションと2つの人間ロボットゲームの両方で検証され、人間のプレイヤーが障害物のある環境での動作計画のための2リンクロボットアームと6-DoFクアドロータシステムを教える。
関連論文リスト
- Self-Supervised Learning of Grasping Arbitrary Objects On-the-Move [8.445514342786579]
本研究では3つの完全畳み込みニューラルネットワーク(FCN)モデルを導入し,視覚入力から静的グリッププリミティブ,動的グリッププリミティブ,残留移動速度誤差を予測する。
提案手法は高い把握精度とピック・アンド・プレイス効率を実現した。
論文 参考訳(メタデータ) (2024-11-15T02:59:16Z) - Unsupervised Learning of Effective Actions in Robotics [0.9374652839580183]
ロボット工学における現在の最先端のアクション表現は、ロボットのアクションに対する適切な効果駆動学習を欠いている。
連続運動空間の離散化と「アクションプロトタイプ」生成のための教師なしアルゴリズムを提案する。
シミュレーションされた階段登上補強学習課題について,本手法の評価を行った。
論文 参考訳(メタデータ) (2024-04-03T13:28:52Z) - "No, to the Right" -- Online Language Corrections for Robotic
Manipulation via Shared Autonomy [70.45420918526926]
LILACは、実行中に自然言語の修正をオンラインで実施し、適応するためのフレームワークである。
LILACは人間とロボットを個別にターンテイクする代わりに、人間とロボットの間にエージェンシーを分割する。
提案手法は,タスク完了率が高く,ユーザによって主観的に好まれることを示す。
論文 参考訳(メタデータ) (2023-01-06T15:03:27Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - Correcting Robot Plans with Natural Language Feedback [88.92824527743105]
ロボットの修正のための表現的かつ柔軟なツールとして自然言語を探索する。
これらの変換により、ユーザは目標を正し、ロボットの動きを更新し、計画上のエラーから回復できる。
本手法により,シミュレーション環境や実環境において,複数の制約を合成し,未知のシーン,オブジェクト,文に一般化することが可能となる。
論文 参考訳(メタデータ) (2022-04-11T15:22:43Z) - Goal-conditioned dual-action imitation learning for dexterous dual-arm robot manipulation [4.717749411286867]
バナナの皮剥きなどの変形可能な物体の長い水平デキスタスロボット操作は問題となる課題である。
本稿では,目標条件付きデュアルアクション・ディープ・模倣学習(DIL)アプローチを提案する。
論文 参考訳(メタデータ) (2022-03-18T05:17:00Z) - Active Uncertainty Learning for Human-Robot Interaction: An Implicit
Dual Control Approach [5.05828899601167]
暗黙的な二重制御パラダイムに基づくループ内動作計画のための不確実性学習を実現するアルゴリズムを提案する。
提案手法は,動的プログラミングモデル予測制御問題のサンプリングに基づく近似に依拠する。
結果として得られたポリシーは、連続的およびカテゴリー的不確実性を持つ一般的な人間の予測モデルに対する二重制御効果を維持することが示されている。
論文 参考訳(メタデータ) (2022-02-15T20:40:06Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z) - Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning [65.88200578485316]
本稿では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。
提案手法は高雑音環境における動的変化への適応性を著しく改善する。
我々は、動的に変化しながら歩くことを学習する四足歩行ロボットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-03-02T22:56:27Z) - Exploiting Ergonomic Priors in Human-to-Robot Task Transfer [3.60953887026184]
制約された動きデータからヌル空間ポリシーを学習するために,実演によるプログラミングに基づく手法を提案する。
本手法の有効性を3リンクシミュレーションと実世界実験で実証した。
シミュレーションされた3DoFロボットマニピュレータ制御問題において,この手法は最先端のアプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-01T18:30:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。