論文の概要: LARG, Language-based Automatic Reward and Goal Generation
- arxiv url: http://arxiv.org/abs/2306.10985v1
- Date: Mon, 19 Jun 2023 14:52:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 17:17:58.352886
- Title: LARG, Language-based Automatic Reward and Goal Generation
- Title(参考訳): larg, 言語に基づく自動報酬とゴール生成
- Authors: Julien Perez and Denys Proux and Claude Roux and Michael Niemaz
- Abstract要約: テキストベースのタスク記述をそれに対応する報酬とゴール生成関数に変換するアプローチを開発する。
ロボット操作に対する我々のアプローチを評価し、スケーラブルな方法でポリシーを訓練および実行できることを実証する。
- 参考スコア(独自算出の注目度): 8.404316955848602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Goal-conditioned and Multi-Task Reinforcement Learning (GCRL and MTRL)
address numerous problems related to robot learning, including locomotion,
navigation, and manipulation scenarios. Recent works focusing on
language-defined robotic manipulation tasks have led to the tedious production
of massive human annotations to create dataset of textual descriptions
associated with trajectories. To leverage reinforcement learning with
text-based task descriptions, we need to produce reward functions associated
with individual tasks in a scalable manner. In this paper, we leverage recent
capabilities of Large Language Models (LLMs) and introduce \larg,
Language-based Automatic Reward and Goal Generation, an approach that converts
a text-based task description into its corresponding reward and goal-generation
functions We evaluate our approach for robotic manipulation and demonstrate its
ability to train and execute policies in a scalable manner, without the need
for handcrafted reward functions.
- Abstract(参考訳): 目標条件付きマルチタスク強化学習(GCRLとMTRL)は、移動、ナビゲーション、操作シナリオを含む、ロボット学習に関連する多くの問題に対処する。
言語定義のロボット操作タスクに焦点を当てた最近の研究は、トラジェクトリに関連するテキスト記述のデータセットを作成するために、巨大な人間のアノテーションを退屈に作成するに至った。
テキストベースのタスク記述による強化学習を活用するためには,個々のタスクに関連する報酬関数をスケーラブルに生成する必要がある。
本稿では,近年の大規模言語モデル (llms) の機能を活用して,テキストベースのタスク記述を対応する報酬と目標生成関数に変換する手法である \larg,言語ベースの自動報酬と目標生成を導入する。
関連論文リスト
- CurricuLLM: Automatic Task Curricula Design for Learning Complex Robot Skills using Large Language Models [19.73329768987112]
CurricuLLMは複雑なロボット制御タスクのためのカリキュラム学習ツールである。
自然言語形式のタスク学習を支援するサブタスクを生成する。
また、サブタスクの自然言語記述を実行可能なコードに変換する。
CurricuLLMは複雑なロボット制御タスクの学習を支援する。
論文 参考訳(メタデータ) (2024-09-27T01:48:16Z) - Object-Centric Instruction Augmentation for Robotic Manipulation [29.491990994901666]
我々は,高度にセマンティックで情報に富んだ言語命令を位置情報で拡張するために,textitObject-Centric Instruction Augmentation (OCI)フレームワークを導入する。
MLLM(Multi-modal Large Language Model)を用いて,オブジェクト位置の知識を自然言語に織り込む。
我々は,ロボットマニピュレータの模倣政策が,従来の言語指導にのみ依存する者よりも優れていることを実証した。
論文 参考訳(メタデータ) (2024-01-05T13:54:45Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - Mastering Robot Manipulation with Multimodal Prompts through Pretraining and Multi-task Fine-tuning [49.92517970237088]
我々はマルチモーダルなプロンプトを理解するためにロボットを訓練する問題に取り組む。
このようなタスクは、視覚と言語信号の相互接続と相補性を理解するロボットの能力にとって大きな課題となる。
マルチモーダルプロンプトを用いてロボット操作を行うためのポリシーを学習する効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-14T22:24:58Z) - RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic
Control [140.48218261864153]
本研究では,インターネット規模のデータに基づいて学習した視覚言語モデルを,エンドツーエンドのロボット制御に直接組み込む方法について検討する。
提案手法は,インターネット規模のトレーニングから,RT-2による創発的能力の獲得を可能にした。
論文 参考訳(メタデータ) (2023-07-28T21:18:02Z) - Towards A Unified Agent with Foundation Models [18.558328028366816]
強化学習(RL)エージェントにそのような能力を組み込んで活用する方法を検討する。
我々は、言語を中核的推論ツールとして使用するフレームワークを設計し、エージェントが一連の基本的なRL課題にどのように取り組むことができるかを探る。
探索効率とオフラインデータセットからのデータの再利用能力において,ベースラインよりも大幅にパフォーマンスが向上したことを示す。
論文 参考訳(メタデータ) (2023-07-18T22:37:30Z) - ProgPrompt: Generating Situated Robot Task Plans using Large Language
Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。
本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文 参考訳(メタデータ) (2022-09-22T20:29:49Z) - Summarizing a virtual robot's past actions in natural language [0.3553493344868413]
本稿では,ロボット行動と自然言語記述とを一致させた一般的なデータセットを,ロボット行動要約作業のトレーニング場として活用する方法について述べる。
自動プランナーが使用する動作の中間テキスト表現や、ロボットの自我中心の映像フレームから、このような要約を生成するためのいくつかの方法を提案し、テストする。
論文 参考訳(メタデータ) (2022-03-13T15:00:46Z) - Learning Language-Conditioned Robot Behavior from Offline Data and
Crowd-Sourced Annotation [80.29069988090912]
本研究では,ロボットインタラクションの大規模なオフラインデータセットから視覚に基づく操作タスクを学習する問題について検討する。
クラウドソースの自然言語ラベルを用いたオフラインロボットデータセットの活用を提案する。
提案手法は目標画像仕様と言語条件付き模倣技術の両方を25%以上上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-02T17:42:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。