論文の概要: Interactive Hierarchical Guidance using Language
- arxiv url: http://arxiv.org/abs/2110.04649v1
- Date: Sat, 9 Oct 2021 21:34:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 17:37:24.907995
- Title: Interactive Hierarchical Guidance using Language
- Title(参考訳): 言語を用いた対話型階層型指導
- Authors: Bharat Prakash, Nicholas Waytowich, Tim Oates, Tinoosh Mohsenin
- Abstract要約: サブタスクを指定するために言語を使用するアプローチを導入し、低レベルコントローラに言語コマンドを発行する。
提案手法は,人間の監督を限定した複雑な長期水平計画課題を解くことができることを示す。
- 参考スコア(独自算出の注目度): 5.797847756967884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning has been successful in many tasks ranging from robotic
control, games, energy management etc. In complex real world environments with
sparse rewards and long task horizons, sample efficiency is still a major
challenge. Most complex tasks can be easily decomposed into high-level planning
and low level control. Therefore, it is important to enable agents to leverage
the hierarchical structure and decompose bigger tasks into multiple smaller
sub-tasks. We introduce an approach where we use language to specify sub-tasks
and a high-level planner issues language commands to a low level controller.
The low-level controller executes the sub-tasks based on the language commands.
Our experiments show that this method is able to solve complex long horizon
planning tasks with limited human supervision. Using language has added benefit
of interpretability and ability for expert humans to take over the high-level
planning task and provide language commands if necessary.
- Abstract(参考訳): 強化学習は、ロボット制御、ゲーム、エネルギー管理など、多くのタスクで成功しています。
少ない報酬と長いタスクホライズンズを持つ複雑な実環境において、サンプル効率は依然として大きな課題である。
ほとんどの複雑なタスクは、簡単にハイレベルな計画と低レベルな制御に分解できる。
したがって、エージェントが階層構造を活用し、より大きなタスクを複数の小さなサブタスクに分割することが重要である。
我々は,サブタスクを言語で指定し,高レベルプランナーが低レベルコントローラに言語コマンドを発行する手法を提案する。
低レベルコントローラは言語コマンドに基づいてサブタスクを実行する。
提案手法は,人間の監督を限定した複雑な長期水平計画課題を解くことができることを示す。
言語の使用は、解釈可能性と専門家の人間が高いレベルの計画タスクを引き継ぎ、必要に応じて言語コマンドを提供する能力の恩恵を追加した。
関連論文リスト
- Learning adaptive planning representations with natural language
guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。
Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文 参考訳(メタデータ) (2023-12-13T23:35:31Z) - Interactive Task Planning with Language Models [97.86399877812923]
対話型ロボットフレームワークは、長期のタスクプランニングを達成し、実行中であっても、新しい目標や異なるタスクに容易に一般化することができる。
最近の大規模言語モデルに基づくアプローチは、よりオープンな計画を可能にするが、多くの場合、重いプロンプトエンジニアリングやドメイン固有の事前訓練されたモデルを必要とする。
本稿では,言語モデルを用いた対話型タスクプランニングを実現するためのシンプルなフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-16T17:59:12Z) - LEMMA: Learning Language-Conditioned Multi-Robot Manipulation [21.75163634731677]
LanguagE-Conditioned Multi-robot Manipulation (LEMMA)
LeMMAは、手続き的に生成されるタスクが8種類あり、複雑さは様々である。
それぞれのタスクに対して,800の専門的なデモンストレーションと,トレーニングと評価のためのヒューマンインストラクションを提供します。
論文 参考訳(メタデータ) (2023-08-02T04:37:07Z) - AutoTAMP: Autoregressive Task and Motion Planning with LLMs as
Translators and Checkers [22.10114075378893]
人間とロボットの効果的なインタラクションには、ロボットは複雑な長期的タスクを理解し、計画し、実行する必要がある。
大規模言語モデルの最近の進歩は、自然言語をロボットのアクションシーケンスに変換することを約束している。
本研究では,複雑なタスク領域において,LLMをプランナとして用いる手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-10T21:58:29Z) - Robot Task Planning Based on Large Language Model Representing Knowledge
with Directed Graph Structures [2.3698227130544547]
本研究では,人間の専門知識をLLMと組み合わせたタスクプランニング手法を提案し,LLMプロンプトテンプレートであるThink_Net_Promptを設計した。
さらに,タスクを段階的に分解し,タスクツリーを生成して各タスクの計画量を削減する手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T13:10:00Z) - Plan, Eliminate, and Track -- Language Models are Good Teachers for
Embodied Agents [99.17668730578586]
事前訓練された大言語モデル(LLM)は、世界に関する手続き的な知識をキャプチャする。
Plan, Eliminate, and Track (PET)フレームワークはタスク記述をハイレベルなサブタスクのリストに変換する。
PETフレームワークは、人間の目標仕様への一般化のために、SOTAよりも15%改善されている。
論文 参考訳(メタデータ) (2023-05-03T20:11:22Z) - Decomposed Prompting: A Modular Approach for Solving Complex Tasks [55.42850359286304]
本稿では,より単純なサブタスクに分解することで,複雑なタスクを解くための分解プロンプトを提案する。
このモジュール構造は、各プロンプトを特定のサブタスクに最適化することを可能にする。
Decomposed Promptingの柔軟性とモジュラリティは、数発のプロンプトで先行作業より優れていることを示す。
論文 参考訳(メタデータ) (2022-10-05T17:28:20Z) - Learning Language-Conditioned Robot Behavior from Offline Data and
Crowd-Sourced Annotation [80.29069988090912]
本研究では,ロボットインタラクションの大規模なオフラインデータセットから視覚に基づく操作タスクを学習する問題について検討する。
クラウドソースの自然言語ラベルを用いたオフラインロボットデータセットの活用を提案する。
提案手法は目標画像仕様と言語条件付き模倣技術の両方を25%以上上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-02T17:42:13Z) - A Persistent Spatial Semantic Representation for High-level Natural
Language Instruction Execution [54.385344986265714]
本稿では,言語行動とロボット行動のギャップを埋めるために,永続的な空間意味表現法を提案する。
一般的なステップバイステップ命令を完全に回避しながら、ALFREDベンチマークに対する我々のアプローチを評価し、最先端の結果を得る。
論文 参考訳(メタデータ) (2021-07-12T17:47:19Z) - Ask Your Humans: Using Human Instructions to Improve Generalization in
Reinforcement Learning [32.82030512053361]
本研究では、自然言語の指示や行動軌跡の形で、ステップバイステップの人間の実演を行うことを提案する。
人間のデモは、最も複雑なタスクを解決するのに役立ちます。
また、自然言語を組み込むことで、ゼロショット設定で未確認のタスクを一般化できることがわかった。
論文 参考訳(メタデータ) (2020-11-01T14:39:46Z) - DeComplex: Task planning from complex natural instructions by a
collocating robot [3.158346511479111]
自然言語表現は言語的な変化が大きいため、人間の意図したタスクを実行するのは簡単ではない。
既存の作業では、一度に1つのタスク命令がロボットに与えられるか、命令に複数の独立したタスクが存在すると仮定している。
本稿では,自然言語命令で与えられた複数の相互依存タスクの実行順序を求める手法を提案する。
論文 参考訳(メタデータ) (2020-08-23T18:10:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。