論文の概要: Learning Generalizable Tool-use Skills through Trajectory Generation
- arxiv url: http://arxiv.org/abs/2310.00156v1
- Date: Fri, 29 Sep 2023 21:32:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 06:11:27.012123
- Title: Learning Generalizable Tool-use Skills through Trajectory Generation
- Title(参考訳): 軌道生成による汎用ツールスキルの学習
- Authors: Carl Qi, Sarthak Shetty, Xingyu Lin, David Held
- Abstract要約: 本稿では,ツール利用トラジェクトリの生成モデルを点雲列として学習することを提案する。
ツール使用軌跡を生成し、ツールポーズのシーケンスを最適化し、生成された軌跡と整合する。
本モデルでは,タスク毎に1つのツールからサンプルデータをトレーニングし,様々な新しいツールに一般化することができる。
- 参考スコア(独自算出の注目度): 14.523879777439067
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Autonomous systems that efficiently utilize tools can assist humans in
completing many common tasks such as cooking and cleaning. However, current
systems fall short of matching human-level of intelligence in terms of adapting
to novel tools. Prior works based on affordance often make strong assumptions
about the environments and cannot scale to more complex, contact-rich tasks. In
this work, we tackle this challenge and explore how agents can learn to use
previously unseen tools to manipulate deformable objects. We propose to learn a
generative model of the tool-use trajectories as a sequence of point clouds,
which generalizes to different tool shapes. Given any novel tool, we first
generate a tool-use trajectory and then optimize the sequence of tool poses to
align with the generated trajectory. We train a single model for four different
challenging deformable object manipulation tasks. Our model is trained with
demonstration data from just a single tool for each task and is able to
generalize to various novel tools, significantly outperforming baselines.
Additional materials can be found on our project website:
https://sites.google.com/view/toolgen.
- Abstract(参考訳): 効率的にツールを利用する自律システムは、調理や清掃などの多くの一般的なタスクを人間に完了させるのに役立つ。
しかし、現在のシステムは、新しいツールに適応するという意味では、人間のレベルの知性に合わない。
余裕に基づく先行研究は、しばしば環境について強い仮定をし、より複雑で接触に富んだタスクにスケールできない。
本研究では、この課題に取り組み、エージェントが未発見のツールを使って変形可能なオブジェクトを操作する方法を探求する。
本稿では,ツール利用軌跡の生成モデルを点雲列として学習し,ツール形状を一般化する手法を提案する。
新たなツールが与えられたら、まずツール使用の軌跡を生成し、生成した軌跡に合うようにツールポーズのシーケンスを最適化します。
4つの異なる難解な変形可能なオブジェクト操作タスクに対して、1つのモデルをトレーニングする。
本モデルでは,タスク毎に1つのツールから1つのデモデータをトレーニングし,様々な新しいツールに一般化し,ベースラインを大幅に上回っている。
追加資料はプロジェクトのWebサイト(https://sites.google.com/view/toolgen.com)で参照できます。
関連論文リスト
- MetaTool: Facilitating Large Language Models to Master Tools with Meta-task Augmentation [25.360660222418183]
再利用可能なツールセットにまたがって一般化するために設計された,新しいツール学習手法であるMetaToolを紹介する。
メタタスクデータをタスク指向トレーニングに組み込むことで,オープンソースの大規模言語モデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2024-07-15T10:15:41Z) - Chain of Tools: Large Language Model is an Automatic Multi-tool Learner [54.992464510992605]
Automatic Tool Chain(ATC)は、大規模言語モデル(LLM)がマルチツールユーザとして機能することを可能にするフレームワークである。
次に,ツールの範囲を拡大するために,ブラックボックス探索法を提案する。
包括的な評価のために、ToolFlowという挑戦的なベンチマークを構築しました。
論文 参考訳(メタデータ) (2024-05-26T11:40:58Z) - EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction [56.02100384015907]
EasyToolは、多種多様で長いツールドキュメントを統一的で簡潔なツール命令に変換するフレームワークである。
トークン使用量を大幅に削減し、現実のシナリオにおけるツール利用のパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2024-01-11T15:45:11Z) - Learning Generalizable Tool Use with Non-rigid Grasp-pose Registration [29.998917158604694]
本稿では,ツール使用行動の強化学習を可能にする新しい手法を提案する。
私たちのアプローチは、ひとつのデモだけで新しいカテゴリのツールの操作を学ぶためのスケーラブルな方法を提供します。
学習したポリシーは複雑なツールの使用タスクを解決し、テスト時に見えないツールに一般化する。
論文 参考訳(メタデータ) (2023-07-31T08:49:11Z) - ToolAlpaca: Generalized Tool Learning for Language Models with 3000
Simulated Cases [49.7798644853604]
本稿では,多種多様なツール利用コーパスを自動生成し,コンパクト言語モデル上での汎用ツール利用能力を学習するためのフレームワークであるToolAlpacaを紹介する。
ToolAlpacaは,GPT-3.5のような非常に大きな言語モデルに匹敵する,効果的な汎用ツール利用能力を実現する。
論文 参考訳(メタデータ) (2023-06-08T15:46:32Z) - Making Language Models Better Tool Learners with Execution Feedback [36.30542737293863]
ツールは、人間が環境を理解し、形を変えることができる重要なインターフェースとして機能する。
既存のツール学習手法は、ツールを無差別に活用するために大きな言語モデルを誘導する。
ツール実行からのフィードバックを通じてモデルを継続的に学習することを可能にする2段階のエンドツーエンドフレームワークであるTool leaRning wIth exeCution fEedback (TRICE)を提案する。
論文 参考訳(メタデータ) (2023-05-22T14:37:05Z) - Tool Learning with Foundation Models [158.8640687353623]
基礎モデルの出現により、AIシステムは、人間としてのツールの使用に等しく適応できる可能性がある。
その大きな可能性にもかかわらず、この分野における重要な課題、機会、そして将来の取り組みに関する包括的な理解はいまだに欠けている。
論文 参考訳(メタデータ) (2023-04-17T15:16:10Z) - Toolformer: Language Models Can Teach Themselves to Use Tools [62.04867424598204]
言語モデル(LM)は、特に大規模において、いくつかの例やテキスト命令から新しいタスクを解く素晴らしい能力を示す。
LMは、シンプルなAPIを通じて外部ツールの使用を自覚し、両方の世界のベストを達成できることを示します。
Toolformerは、どのAPIを呼び出すか、いつ呼び出すか、どの引数を渡すか、結果を将来のトークン予測に最もうまく組み込む方法を訓練したモデルです。
論文 参考訳(メタデータ) (2023-02-09T16:49:57Z) - DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools [96.38972082580294]
DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文 参考訳(メタデータ) (2022-03-31T17:59:38Z) - TANGO: Commonsense Generalization in Predicting Tool Interactions for
Mobile Manipulators [15.61285199988595]
タスク固有のツール相互作用を予測するための新しいニューラルモデルであるTANGOを紹介します。
TANGOは、グラフニューラルネットワークを使用して、オブジェクトとそれらの間のシンボリックな関係からなる世界状態をエンコードする。
知識ベースから学習した組込みによる環境表現の強化により,新しい環境に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2021-05-05T18:11:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。