論文の概要: BLAZER: Bootstrapping LLM-based Manipulation Agents with Zero-Shot Data Generation
- arxiv url: http://arxiv.org/abs/2510.08572v1
- Date: Thu, 09 Oct 2025 17:59:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:15.31523
- Title: BLAZER: Bootstrapping LLM-based Manipulation Agents with Zero-Shot Data Generation
- Title(参考訳): BLAZER:ゼロショットデータ生成によるブートストラップLDM操作エージェント
- Authors: Rocktim Jyoti Das, Harsh Singh, Diana Turmakhan, Muhammad Abdullah Sohail, Mingfei Han, Preslav Nakov, Fabio Pizzati, Ivan Laptev,
- Abstract要約: BLAZERは、自動生成されたトレーニングデータから操作ポリシーを学ぶフレームワークである。
シミュレーション環境と実環境の両方において、BLAZERはゼロショット操作を大幅に改善することを示す。
私たちのコードとデータはプロジェクトのページで公開されます。
- 参考スコア(独自算出の注目度): 59.70634559248202
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scaling data and models has played a pivotal role in the remarkable progress of computer vision and language. Inspired by these domains, recent efforts in robotics have similarly focused on scaling both data and model size to develop more generalizable and robust policies. However, unlike vision and language, robotics lacks access to internet-scale demonstrations across diverse robotic tasks and environments. As a result, the scale of existing datasets typically suffers from the need for manual data collection and curation. To address this problem, here we propose BLAZER, a framework that learns manipulation policies from automatically generated training data. We build on the zero-shot capabilities of LLM planners and automatically generate demonstrations for diverse manipulation tasks in simulation. Successful examples are then used to finetune an LLM and to improve its planning capabilities without human supervision. Notably, while BLAZER training requires access to the simulator's state, we demonstrate direct transfer of acquired skills to sensor-based manipulation. Through extensive experiments, we show BLAZER to significantly improve zero-shot manipulation in both simulated and real environments. Moreover, BLAZER improves on tasks outside of its training pool and enables downscaling of LLM models. Our code and data will be made publicly available on the project page.
- Abstract(参考訳): データとモデルをスケールすることは、コンピュータビジョンと言語の顕著な進歩において重要な役割を担っている。
これらの領域にインスパイアされた最近のロボティクスの取り組みも、より汎用的で堅牢なポリシーを開発するために、データとモデルサイズのスケーリングに重点を置いている。
しかし、視覚や言語とは異なり、ロボティクスは様々なロボットのタスクや環境にまたがるインターネット規模のデモへのアクセスを欠いている。
その結果、既存のデータセットのスケールは通常、手動のデータ収集とキュレーションの必要性に悩まされる。
そこで本研究では,自動生成学習データから操作ポリシーを学習するフレームワークであるBLAZERを提案する。
LLMプランナのゼロショット機能に基づいて,シミュレーションにおける多様な操作タスクのデモを自動的に生成する。
成功した例は、LLMを微調整し、人間の監督なしに計画能力を改善するために使われる。
特に、BLAZERトレーニングではシミュレータの状態にアクセスする必要があるが、取得したスキルを直接センサベース操作に転送する様子を実演する。
実験により,BLAZERは実環境とシミュレーション環境の両方において,ゼロショット操作を大幅に改善することを示す。
さらに、BLAZERはトレーニングプール外のタスクを改善し、LLMモデルのダウンスケーリングを可能にする。
私たちのコードとデータはプロジェクトのページで公開されます。
関連論文リスト
- Latent Action Pretraining Through World Modeling [1.988007188564225]
自己教師型手法で模倣学習モデルを事前学習するためのモデルに依存しないフレームワークであるLAWMを提案する。
当社のフレームワークは,タスクや環境,実施環境の移動に有効であるように設計されています。
論文 参考訳(メタデータ) (2025-09-22T21:19:10Z) - KALIE: Fine-Tuning Vision-Language Models for Open-World Manipulation without Robot Data [45.25288643161976]
本稿では,ロボット制御をスケーラブルに行うために,KALIE(Keypoint Affordance Learning from Imagined Environments)を提案する。
モーターコマンドを直接生成する代わりに、KALIEはポイントベースの価格表現を予測してロボットを制御する。
我々はKALIEが、50個のデータポイントしか持たない未確認オブジェクトで、新しい操作タスクを堅牢に解くことができることを実証した。
論文 参考訳(メタデータ) (2024-09-21T08:45:16Z) - LLaRA: Supercharging Robot Learning Data for Vision-Language Policy [56.505551117094534]
我々はLLaRA: Large Language and Robotics Assistantを紹介した。
まず、既存の行動クローニングデータセットからロボットのための会話スタイルの指導データを生成する自動パイプラインを提案する。
このようなデータセットを限定的に微調整したVLMは、ロボット制御において有意義な行動決定を導出できることを示す。
論文 参考訳(メタデータ) (2024-06-28T17:59:12Z) - Any-point Trajectory Modeling for Policy Learning [64.23861308947852]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。