論文の概要: TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2603.09971v1
- Date: Tue, 10 Mar 2026 17:59:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.171856
- Title: TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation
- Title(参考訳): TiPToP:ロボットマニピュレーションのためのモジュール型オープン語彙計画システム
- Authors: William Shen, Nishanth Kumar, Sahit Chintalapudi, Jie Wang, Christopher Watson, Edward Hu, Jing Cao, Dinesh Jayaraman, Leslie Pack Kaelbling, Tomás Lozano-Pérez,
- Abstract要約: TiPToPはマルチステップ操作タスクを解決するモジュールシステムである。
標準のDROIDセットアップで1時間以内にインストールして実行することができる。
シミュレーションおよび実世界における28のテーブルトップ操作タスクについて,TiPToPの評価を行った。
- 参考スコア(独自算出の注目度): 33.646108712135174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present TiPToP, an extensible modular system that combines pretrained vision foundation models with an existing Task and Motion Planner (TAMP) to solve multi-step manipulation tasks directly from input RGB images and natural-language instructions. Our system aims to be simple and easy-to-use: it can be installed and run on a standard DROID setup in under one hour and adapted to new embodiments with minimal effort. We evaluate TiPToP -- which requires zero robot data -- over 28 tabletop manipulation tasks in simulation and the real world and find it matches or outperforms $π_{0.5}\text{-DROID}$, a vision-language-action (VLA) model fine-tuned on 350 hours of embodiment-specific demonstrations. TiPToP's modular architecture enables us to analyze the system's failure modes at the component level. We analyze results from an evaluation of 173 trials and identify directions for improvement. We release TiPToP open-source to further research on modular manipulation systems and tighter integration between learning and planning. Project website and code: https://tiptop-robot.github.io
- Abstract(参考訳): 本稿では、既存のタスク・アンド・モーション・プランナー(TAMP)と事前学習された視覚基盤モデルを組み合わせた拡張可能なモジュラーシステムTiPToPを提案し、入力されたRGB画像と自然言語命令から直接多段階操作タスクを解決する。
1時間以内で標準のDROIDセットアップをインストールして実行でき、最小限の労力で新しい実施環境に適応できる。
シミュレーションおよび実世界における28以上のテーブルトップ操作タスクを対象とし,350時間にわたる実演で微調整された視覚言語アクション(VLA)モデルである,π_{0.5}\text{-DROID}$と一致するか,あるいは性能に優れていたTiPToPの評価を行った。
TiPToPのモジュールアーキテクチャにより、コンポーネントレベルでシステムの障害モードを分析することができる。
173治験の評価から結果を分析し,改善の道筋を特定した。
我々はTiPToPをオープンソースとして公開し、モジュラー操作システムについてさらなる研究を行い、学習と計画の緊密な統合を図っている。
プロジェクトウェブサイトとコード:https://tiptop-robot.github.io
関連論文リスト
- LLM$\times$MapReduce-V3: Enabling Interactive In-Depth Survey Generation through a MCP-Driven Hierarchically Modular Agent System [55.33058620876928]
LLM x MapReduce-V3 は、長期サーベイ生成のための階層的モジュラーエージェントシステムである。
システムは研究の視点を捉えて包括的な骨格を生成し、それを詳細な調査へと発展させる。
人間の評価から,本システムはコンテンツ深度と長さの両方において,代表的ベースラインを超越していることが示された。
論文 参考訳(メタデータ) (2025-10-13T01:38:37Z) - EasySteer: A Unified Framework for High-Performance and Extensible LLM Steering [55.56674028743782]
大規模言語モデル(LLM)のステアリングは、推論時にモデル動作を制御するための有望なパラダイムとして登場した。
我々は,vLLM上に構築された高性能LLMステアリングのための統合フレームワークであるEasySteerを提案する。
論文 参考訳(メタデータ) (2025-09-29T17:59:07Z) - Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale [11.166320712764465]
VLA(Vision-Language-Action Model)は、専門的なアーキテクチャと専門家ポリシーのタスクに適したコンポーネントを、大規模なデータ収集とセットアップ固有の微調整に置き換える。
従来のロボットソフトウェアフレームワークはボトルネックとなり、ロボットシミュレーションは、実世界の実験への移行を限定的にサポートする。
我々は、大規模なジェネラリストポリシーによるロボット学習の研究を支援するために、ゼロから設計されたリーンエコシステムであるRobot Control Stack (RCS)を紹介した。
論文 参考訳(メタデータ) (2025-09-18T13:12:16Z) - U-TOE: Universal TinyML On-board Evaluation Toolkit for Low-Power IoT [3.981958767941474]
U-TOEはIoTデザイナと研究者の作業を容易にするために設計されたユニバーサルツールキットである。
我々は,U-TOEのオープンソース実装を提供し,様々なモデルの性能を実験的に評価するためにその利用を実証する。
論文 参考訳(メタデータ) (2023-06-26T10:35:31Z) - Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions
with Large Language Model [63.66204449776262]
Instruct2Actは、ロボット操作タスクのシーケンシャルアクションにマルチモーダル命令をマッピングするフレームワークである。
我々のアプローチは、様々な命令のモダリティや入力タイプを調節する上で、調整可能で柔軟なものである。
我々のゼロショット法は、いくつかのタスクにおいて、最先端の学習ベースのポリシーよりも優れていた。
論文 参考訳(メタデータ) (2023-05-18T17:59:49Z) - MOSAIC, acomparison framework for machine learning models [0.0]
MOSAICは、機械学習モデルのためのPythonプログラムである。
これにより、任意のネットワークアーキテクチャの実装とテストが簡単で、高速で、エラーの少ないものになる。
論文 参考訳(メタデータ) (2023-01-30T15:29:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。