Fugu-MT 論文翻訳(概要): KiloBot: A Programming Language for Deploying Perception-Guided Industrial Manipulators at Scale

論文の概要: KiloBot: A Programming Language for Deploying Perception-Guided Industrial Manipulators at Scale

arxiv url: http://arxiv.org/abs/2409.03439v1
Date: Thu, 5 Sep 2024 11:42:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-06 20:50:03.362684
Title: KiloBot: A Programming Language for Deploying Perception-Guided Industrial Manipulators at Scale
Title（参考訳）: KiloBot: 知覚誘導型産業用マニピュレータを大規模に展開するプログラミング言語
Authors: Wei Gao, Jingqiang Wang, Xinv Zhu, Jun Zhong, Yue Shen, Youshuang Ding,
Abstract要約: 産業用ロボットは、カメラと知覚パイプラインで非構造環境を処理したいと考えています。知覚誘導型産業応用にはオンライン行動計画が必要である。私たちのDSLは主に、従来のプログラミング言語でコーディング経験のないマシンオペレータによって使われています。
参考スコア（独自算出の注目度）: 6.804432396982314
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We would like industrial robots to handle unstructured environments with cameras and perception pipelines. In contrast to traditional industrial robots that replay offline-crafted trajectories, online behavior planning is required for these perception-guided industrial applications. Aside from perception and planning algorithms, deploying perception-guided manipulators also requires substantial effort in integration. One approach is writing scripts in a traditional language (such as Python) to construct the planning problem and perform integration with other algorithmic modules & external devices. While scripting in Python is feasible for a handful of robots and applications, deploying perception-guided manipulation at scale (e.g., more than 10000 robot workstations in over 2000 customer sites) becomes intractable. To resolve this challenge, we propose a Domain-Specific Language (DSL) for perception-guided manipulation applications. To scale up the deployment,our DSL provides: 1) an easily accessible interface to construct & solve a sub-class of Task and Motion Planning (TAMP) problems that are important in practical applications; and 2) a mechanism to implement flexible control flow to perform integration and address customized requirements of distinct industrial application. Combined with an intuitive graphical programming frontend, our DSL is mainly used by machine operators without coding experience in traditional programming languages. Within hours of training, operators are capable of orchestrating interesting sophisticated manipulation behaviors with our DSL. Extensive practical deployments demonstrate the efficacy of our method.
Abstract（参考訳）: 産業用ロボットは、カメラと知覚パイプラインで非構造環境を処理したいと考えています。オフラインで製作された軌道を再生する従来の産業用ロボットとは対照的に、知覚誘導型産業用アプリケーションにはオンライン行動計画が必要である。知覚と計画のアルゴリズム以外にも、知覚誘導マニピュレータの展開にはかなりの労力が要る。ひとつのアプローチは、計画的な問題を構築し、他のアルゴリズムモジュールや外部デバイスとの統合を実行するために、従来の言語(Pythonなど)でスクリプトを記述することだ。 Pythonのスクリプティングは、少数のロボットやアプリケーションで実現可能だが、認識誘導操作を大規模に展開する(例えば、2000以上の顧客サイトで10000以上のロボットワークステーション)。この課題を解決するために、認識誘導操作アプリケーションのためのドメイン特化言語(DSL)を提案する。デプロイメントをスケールアップするために、私たちのDSLは次のように提供します。 1)実用上重要なタスク・アンド・モーション・プランニング(TAMP)のサブクラスを構築・解決するための容易なインターフェース。 2) 異なる産業用アプリケーションのカスタマイズ要求に対処し、統合を行うためのフレキシブルな制御フローを実装するためのメカニズム。直感的なグラフィカルプログラミングのフロントエンドと組み合わせることで、私たちのDSLは主に従来のプログラミング言語でコーディング経験のないマシンオペレータによって使われます。訓練から数時間以内に、オペレータは興味深い高度な操作動作をDSLでオーケストレーションすることができます。大規模な実践的展開は,本手法の有効性を実証する。

関連論文リスト

Trajectory Adaptation using Large Language Models [0.8704964543257245]
新しい状況に応じた人間の指示に基づくロボット軌道の適応は、より直感的でスケーラブルな人間とロボットの相互作用を実現するために不可欠である。本研究は,市販の移動プランナが生成する汎用ロボット軌道に適応する柔軟な言語ベースのフレームワークを提案する。我々は、事前学習されたLLMを用いて、高密度ロボット操作のポリシーとしてコードを生成することにより、軌道方向の経路を適応させる。
論文参考訳（メタデータ） (2025-04-17T08:48:23Z)
AI-based Framework for Robust Model-Based Connector Mating in Robotic Wire Harness Installation [1.543743835720528]
我々は、力制御と深層ビゾタクティル学習を統合することで、ケーブルコネクタの配座を自動化する新しいAIベースのフレームワークを設計する。視覚的・触覚的・受容的データに基づいて学習したマルチモーダルトランスフォーマーアーキテクチャ上での1次最適化を用いた探索・挿入戦略を最適化する。
論文参考訳（メタデータ） (2025-03-12T13:59:26Z)
$π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文参考訳（メタデータ） (2024-10-31T17:22:30Z)
RAMPA: Robotic Augmented Reality for Machine Programming and Automation [4.963604518596734]
本稿では,RAMPA(Robotic Augmented Reality for Machine Programming)を紹介する。 RAMPAは最先端のARヘッドセット、例えばMeta Quest 3の能力を利用するシステムである。提案手法は,ユーザの物理的環境内で直接,スキルデモのその場でのデータ記録,可視化,微調整を可能にする。
論文参考訳（メタデータ） (2024-10-17T10:21:28Z)
Octo: An Open-Source Generalist Robot Policy [88.14295917143188]
ここでは,Open X-Embodimentデータセットから800kトラジェクトリをトレーニングした,大規模なトランスフォーマーベースのポリシであるOctoを紹介する。標準のGPUでは数時間以内に、新しいセンサー入力とアクションスペースを備えたロボットセットアップに効果的にカスタマイズできる。また,アーキテクチャからトレーニングデータに至るまで,Octoモデルの設計決定の詳細な説明を行い,汎用ロボットモデルの構築に関する今後の研究を指導する。
論文参考訳（メタデータ） (2024-05-20T17:57:01Z)
RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文参考訳（メタデータ） (2024-02-22T15:12:00Z)
LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。 CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文参考訳（メタデータ） (2024-01-10T00:08:00Z)
Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions with Large Language Model [63.66204449776262]
Instruct2Actは、ロボット操作タスクのシーケンシャルアクションにマルチモーダル命令をマッピングするフレームワークである。我々のアプローチは、様々な命令のモダリティや入力タイプを調節する上で、調整可能で柔軟なものである。我々のゼロショット法は、いくつかのタスクにおいて、最先端の学習ベースのポリシーよりも優れていた。
論文参考訳（メタデータ） (2023-05-18T17:59:49Z)
ProgPrompt: Generating Situated Robot Task Plans using Large Language Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文参考訳（メタデータ） (2022-09-22T20:29:49Z)
Towards Plug'n Play Task-Level Autonomy for Robotics Using POMDPs and Generative Models [0.0]
ロボットのスキルを、特定のタスクを達成するためにそのスキルをスケジュールする作業自律型ロボットコントローラに統合するアプローチについて述べる。私たちのジェネレーティブスキルドキュメンテーション言語(GSDL)は、コードドキュメンテーションをコンパクトで表現力のあるものにします。抽象マッピング(AM)は、低レベルのロボットコードと抽象AI計画モデルとのギャップを埋める。
論文参考訳（メタデータ） (2022-07-20T07:27:47Z)
Manipulation of Articulated Objects using Dual-arm Robots via Answer Set Programming [10.316694915810947]
調音物体の操作はロボティクスにおいて最も重要なものであり、最も複雑な操作の1つと見なすことができる。従来、この問題は、柔軟性と移植性に欠けるアドホックなアプローチによって対処されてきた。本稿では,ロボット制御アーキテクチャにおける調音オブジェクトの自動操作のための解答セットプログラミング(ASP)に基づくフレームワークを提案する。
論文参考訳（メタデータ） (2020-10-02T18:50:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。