論文の概要: Imagining In-distribution States: How Predictable Robot Behavior Can Enable User Control Over Learned Policies
- arxiv url: http://arxiv.org/abs/2406.13711v1
- Date: Wed, 19 Jun 2024 17:08:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 18:45:06.775735
- Title: Imagining In-distribution States: How Predictable Robot Behavior Can Enable User Control Over Learned Policies
- Title(参考訳): 分散状態の想像:学習されたポリシーに対する予測可能なロボットの動作がユーザ制御を可能にする
- Authors: Isaac Sheidlower, Emma Bethel, Douglas Lilly, Reuben M. Aronson, Elaine Schaertl Short,
- Abstract要約: Imaginary Out-of-Distribution Actions, IODAは, ロボットの行動に対する期待を利用して新しいタスクを遂行するアルゴリズムである。
IODAは、タスクパフォーマンスの向上と、ロボットの動作とユーザの期待の一致の度合いの向上につながる。
- 参考スコア(独自算出の注目度): 1.6078134198754157
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: It is crucial that users are empowered to take advantage of the functionality of a robot and use their understanding of that functionality to perform novel and creative tasks. Given a robot trained with Reinforcement Learning (RL), a user may wish to leverage that autonomy along with their familiarity of how they expect the robot to behave to collaborate with the robot. One technique is for the user to take control of some of the robot's action space through teleoperation, allowing the RL policy to simultaneously control the rest. We formalize this type of shared control as Partitioned Control (PC). However, this may not be possible using an out-of-the-box RL policy. For example, a user's control may bring the robot into a failure state from the policy's perspective, causing it to act unexpectedly and hindering the success of the user's desired task. In this work, we formalize this problem and present Imaginary Out-of-Distribution Actions, IODA, an initial algorithm which empowers users to leverage their expectations of a robot's behavior to accomplish new tasks. We deploy IODA in a user study with a real robot and find that IODA leads to both better task performance and a higher degree of alignment between robot behavior and user expectation. We also show that in PC, there is a strong and significant correlation between task performance and the robot's ability to meet user expectations, highlighting the need for approaches like IODA. Code is available at https://github.com/AABL-Lab/ioda_roman_2024
- Abstract(参考訳): ユーザーは、ロボットの機能を利用して、その機能を理解して、斬新で創造的なタスクを遂行することが不可欠である。
強化学習(Reinforcement Learning, RL)で訓練されたロボットの場合、ユーザーはロボットがロボットと協調するためにどのように振る舞うかをよく知るとともに、その自律性を活用したいと考えるかもしれない。
1つのテクニックは、遠隔操作によってロボットの動作空間の一部を制御し、RLポリシーを同時に制御することである。
我々は、このタイプの共有制御を、分割制御(Partitioned Control, PC)として定式化する。
しかし、これはアウト・オブ・ボックスのRLポリシーでは不可能である。
例えば、ユーザのコントロールは、ポリシーの観点からロボットを障害状態に陥れ、予期せず動作し、ユーザの望むタスクの成功を妨げる可能性がある。
本研究では,ロボットの動作に対する期待を生かし,新たなタスクを遂行するための初期アルゴリズムであるImaginary Out-of-Distribution Actions, IODAを提案する。
実際のロボットを用いたユーザスタディにおいて、IODAをデプロイし、IODAがより優れたタスクパフォーマンスと、ロボットの振る舞いとユーザ期待との整合性の両方をもたらすことを確認した。
また,PCでは,タスクパフォーマンスとロボットのユーザ期待を満たす能力との間には,強い相関関係があることが示され,IODAのようなアプローチの必要性が強調された。
コードはhttps://github.com/AABL-Lab/ioda_roman_2024で公開されている。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Know your limits! Optimize the robot's behavior through self-awareness [11.021217430606042]
最近の人間ロボット模倣アルゴリズムは、高精度な人間の動きを追従することに焦点を当てている。
本稿では,ロボットが参照を模倣する際の動作を予測できるディープラーニングモデルを提案する。
我々のSAW(Self-AWare Model)は、転倒確率、基準運動への固執、滑らかさといった様々な基準に基づいて、潜在的なロボットの挙動をランク付けする。
論文 参考訳(メタデータ) (2024-09-16T14:14:58Z) - Online Behavior Modification for Expressive User Control of RL-Trained Robots [1.6078134198754157]
オンライン行動修正は、RL学習ポリシーを用いてタスクを自律的に完了すると、ユーザがロボットの行動特性をリアルタイムで制御するパラダイムである。
本稿では,行動多様性に基づくアルゴリズム,ACORD(Adjustable Control of RL Dynamics)を提案する。
論文 参考訳(メタデータ) (2024-08-15T12:28:08Z) - Robotic Control via Embodied Chain-of-Thought Reasoning [86.6680905262442]
学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。
視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。
ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文 参考訳(メタデータ) (2024-07-11T17:31:01Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Modifying RL Policies with Imagined Actions: How Predictable Policies
Can Enable Users to Perform Novel Tasks [0.0]
強化学習に基づくロボットにアクセス可能なユーザは、ロボットの自律性とその行動に関する知識を使用して、新しいタスクを完了したいと考えるかもしれない。
1つの方法は、ユーザが遠隔操作によってロボットのアクション空間の一部を制御し、RLポリシーが残りを同時に制御することである。
本研究では,この問題を形式化し,Imaginary Out-of-Distribution Actions(IODA)を提示する。
論文 参考訳(メタデータ) (2023-12-10T20:40:45Z) - ImitationNet: Unsupervised Human-to-Robot Motion Retargeting via Shared Latent Space [9.806227900768926]
本稿では,ロボットの動きに対する新しいディープラーニング手法を提案する。
本手法では,新しいロボットへの翻訳を容易にする,人間とロボットのペアデータを必要としない。
我々のモデルは、効率と精度の観点から、人間とロボットの類似性に関する既存の研究よりも優れています。
論文 参考訳(メタデータ) (2023-09-11T08:55:04Z) - Exploring AI-enhanced Shared Control for an Assistive Robotic Arm [4.999814847776098]
特に,アートインテリジェンス(AI)を共有制御パラダイムに統合する方法について検討する。
特に,人間とロボットのインターフェースの簡潔な要件に着目した。
論文 参考訳(メタデータ) (2023-06-23T14:19:56Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Joint Mind Modeling for Explanation Generation in Complex Human-Robot
Collaborative Tasks [83.37025218216888]
本稿では,人間とロボットのコラボレーションにおいて,人間のようなコミュニケーションを実現するための新しい説明可能なAI(XAI)フレームワークを提案する。
ロボットは、人間のユーザの階層的なマインドモデルを構築し、コミュニケーションの一形態として自身のマインドの説明を生成する。
その結果,提案手法はロボットの協調動作性能とユーザ認識を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-07-24T23:35:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。