論文の概要: KiloBot: A Programming Language for Deploying Perception-Guided Industrial Manipulators at Scale
- arxiv url: http://arxiv.org/abs/2409.03439v1
- Date: Thu, 5 Sep 2024 11:42:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 20:50:03.362684
- Title: KiloBot: A Programming Language for Deploying Perception-Guided Industrial Manipulators at Scale
- Title(参考訳): KiloBot: 知覚誘導型産業用マニピュレータを大規模に展開するプログラミング言語
- Authors: Wei Gao, Jingqiang Wang, Xinv Zhu, Jun Zhong, Yue Shen, Youshuang Ding,
- Abstract要約: 産業用ロボットは、カメラと知覚パイプラインで非構造環境を処理したいと考えています。
知覚誘導型産業応用にはオンライン行動計画が必要である。
私たちのDSLは主に、従来のプログラミング言語でコーディング経験のないマシンオペレータによって使われています。
- 参考スコア(独自算出の注目度): 6.804432396982314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We would like industrial robots to handle unstructured environments with cameras and perception pipelines. In contrast to traditional industrial robots that replay offline-crafted trajectories, online behavior planning is required for these perception-guided industrial applications. Aside from perception and planning algorithms, deploying perception-guided manipulators also requires substantial effort in integration. One approach is writing scripts in a traditional language (such as Python) to construct the planning problem and perform integration with other algorithmic modules & external devices. While scripting in Python is feasible for a handful of robots and applications, deploying perception-guided manipulation at scale (e.g., more than 10000 robot workstations in over 2000 customer sites) becomes intractable. To resolve this challenge, we propose a Domain-Specific Language (DSL) for perception-guided manipulation applications. To scale up the deployment,our DSL provides: 1) an easily accessible interface to construct & solve a sub-class of Task and Motion Planning (TAMP) problems that are important in practical applications; and 2) a mechanism to implement flexible control flow to perform integration and address customized requirements of distinct industrial application. Combined with an intuitive graphical programming frontend, our DSL is mainly used by machine operators without coding experience in traditional programming languages. Within hours of training, operators are capable of orchestrating interesting sophisticated manipulation behaviors with our DSL. Extensive practical deployments demonstrate the efficacy of our method.
- Abstract(参考訳): 産業用ロボットは、カメラと知覚パイプラインで非構造環境を処理したいと考えています。
オフラインで製作された軌道を再生する従来の産業用ロボットとは対照的に、知覚誘導型産業用アプリケーションにはオンライン行動計画が必要である。
知覚と計画のアルゴリズム以外にも、知覚誘導マニピュレータの展開にはかなりの労力が要る。
ひとつのアプローチは、計画的な問題を構築し、他のアルゴリズムモジュールや外部デバイスとの統合を実行するために、従来の言語(Pythonなど)でスクリプトを記述することだ。
Pythonのスクリプティングは、少数のロボットやアプリケーションで実現可能だが、認識誘導操作を大規模に展開する(例えば、2000以上の顧客サイトで10000以上のロボットワークステーション)。
この課題を解決するために、認識誘導操作アプリケーションのためのドメイン特化言語(DSL)を提案する。
デプロイメントをスケールアップするために、私たちのDSLは次のように提供します。
1)実用上重要なタスク・アンド・モーション・プランニング(TAMP)のサブクラスを構築・解決するための容易なインターフェース。
2) 異なる産業用アプリケーションのカスタマイズ要求に対処し、統合を行うためのフレキシブルな制御フローを実装するためのメカニズム。
直感的なグラフィカルプログラミングのフロントエンドと組み合わせることで、私たちのDSLは主に従来のプログラミング言語でコーディング経験のないマシンオペレータによって使われます。
訓練から数時間以内に、オペレータは興味深い高度な操作動作をDSLでオーケストレーションすることができます。
大規模な実践的展開は,本手法の有効性を実証する。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Grounding Robot Policies with Visuomotor Language Guidance [15.774237279917594]
ロボットポリシーを現在の状況に基盤付けるためのエージェントベースのフレームワークを提案する。
提案するフレームワークは、特定の役割のために設計された会話エージェントのセットで構成されている。
弊社のアプローチは、操作ポリシーを効果的にガイドし、成功率を大幅に向上させることを実証する。
論文 参考訳(メタデータ) (2024-10-09T02:00:37Z) - Octo: An Open-Source Generalist Robot Policy [88.14295917143188]
ここでは,Open X-Embodimentデータセットから800kトラジェクトリをトレーニングした,大規模なトランスフォーマーベースのポリシであるOctoを紹介する。
標準のGPUでは数時間以内に、新しいセンサー入力とアクションスペースを備えたロボットセットアップに効果的にカスタマイズできる。
また,アーキテクチャからトレーニングデータに至るまで,Octoモデルの設計決定の詳細な説明を行い,汎用ロボットモデルの構築に関する今後の研究を指導する。
論文 参考訳(メタデータ) (2024-05-20T17:57:01Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications
to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions
with Large Language Model [63.66204449776262]
Instruct2Actは、ロボット操作タスクのシーケンシャルアクションにマルチモーダル命令をマッピングするフレームワークである。
我々のアプローチは、様々な命令のモダリティや入力タイプを調節する上で、調整可能で柔軟なものである。
我々のゼロショット法は、いくつかのタスクにおいて、最先端の学習ベースのポリシーよりも優れていた。
論文 参考訳(メタデータ) (2023-05-18T17:59:49Z) - ProgPrompt: Generating Situated Robot Task Plans using Large Language
Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。
本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文 参考訳(メタデータ) (2022-09-22T20:29:49Z) - Towards Plug'n Play Task-Level Autonomy for Robotics Using POMDPs and
Generative Models [0.0]
ロボットのスキルを、特定のタスクを達成するためにそのスキルをスケジュールする作業自律型ロボットコントローラに統合するアプローチについて述べる。
私たちのジェネレーティブスキルドキュメンテーション言語(GSDL)は、コードドキュメンテーションをコンパクトで表現力のあるものにします。
抽象マッピング(AM)は、低レベルのロボットコードと抽象AI計画モデルとのギャップを埋める。
論文 参考訳(メタデータ) (2022-07-20T07:27:47Z) - Manipulation of Articulated Objects using Dual-arm Robots via Answer Set
Programming [10.316694915810947]
調音物体の操作はロボティクスにおいて最も重要なものであり、最も複雑な操作の1つと見なすことができる。
従来、この問題は、柔軟性と移植性に欠けるアドホックなアプローチによって対処されてきた。
本稿では,ロボット制御アーキテクチャにおける調音オブジェクトの自動操作のための解答セットプログラミング(ASP)に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-02T18:50:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。