論文の概要: GenSwarm: Scalable Multi-Robot Code-Policy Generation and Deployment via Language Models
- arxiv url: http://arxiv.org/abs/2503.23875v1
- Date: Mon, 31 Mar 2025 09:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:33:22.062772
- Title: GenSwarm: Scalable Multi-Robot Code-Policy Generation and Deployment via Language Models
- Title(参考訳): GenSwarm: スケーラブルなマルチロボットコードポリシー生成と言語モデルによるデプロイ
- Authors: Wenkang Ji, Huaben Chen, Mingyang Chen, Guobin Zhu, Lufeng Xu, Roderich Groß, Rui Zhou, Ming Cao, Shiyu Zhao,
- Abstract要約: GenSwarmは、自然言語のシンプルなユーザ命令に基づいて、マルチロボットタスクの制御ポリシーを生成し、デプロイするエンドツーエンドシステムである。
マルチ言語エージェントシステムとして、GenSwarmはゼロショット学習を実現し、変更や未確認タスクへの迅速な適応を可能にする。
- 参考スコア(独自算出の注目度): 17.522946748641324
- License:
- Abstract: The development of control policies for multi-robot systems traditionally follows a complex and labor-intensive process, often lacking the flexibility to adapt to dynamic tasks. This has motivated research on methods to automatically create control policies. However, these methods require iterative processes of manually crafting and refining objective functions, thereby prolonging the development cycle. This work introduces \textit{GenSwarm}, an end-to-end system that leverages large language models to automatically generate and deploy control policies for multi-robot tasks based on simple user instructions in natural language. As a multi-language-agent system, GenSwarm achieves zero-shot learning, enabling rapid adaptation to altered or unseen tasks. The white-box nature of the code policies ensures strong reproducibility and interpretability. With its scalable software and hardware architectures, GenSwarm supports efficient policy deployment on both simulated and real-world multi-robot systems, realizing an instruction-to-execution end-to-end functionality that could prove valuable for robotics specialists and non-specialists alike.The code of the proposed GenSwarm system is available online: https://github.com/WindyLab/GenSwarm.
- Abstract(参考訳): マルチロボットシステムの制御ポリシーの開発は、伝統的に複雑で労働集約的なプロセスに従っており、しばしば動的タスクに適応する柔軟性に欠ける。
これは制御ポリシーを自動作成する方法の研究を動機付けている。
しかし, これらの手法は, 目的関数を手作業で作成・精錬し, 開発サイクルを延長する反復的なプロセスを必要とする。
これは、大規模言語モデルを利用して、自然言語の単純なユーザ命令に基づいて、マルチロボットタスクの制御ポリシーを自動生成し、デプロイするエンド・ツー・エンドのシステムである。
マルチ言語エージェントシステムとして、GenSwarmはゼロショット学習を実現し、変更や未確認タスクへの迅速な適応を可能にする。
コードポリシーのホワイトボックスの性質は、強い再現性と解釈可能性を保証する。
スケーラブルなソフトウェアとハードウェアアーキテクチャにより、GenSwarmは、シミュレーションと実世界の両方のマルチロボットシステムの効率的なポリシー展開をサポートし、ロボット専門家や非スペシャリストにとって価値のある、命令から実行までのエンドツーエンド機能を実現する。提案されたGenSwarmシステムのコードはオンラインで利用可能である。
関連論文リスト
- Grounding Robot Policies with Visuomotor Language Guidance [15.774237279917594]
ロボットポリシーを現在の状況に基盤付けるためのエージェントベースのフレームワークを提案する。
提案するフレームワークは、特定の役割のために設計された会話エージェントのセットで構成されている。
弊社のアプローチは、操作ポリシーを効果的にガイドし、成功率を大幅に向上させることを実証する。
論文 参考訳(メタデータ) (2024-10-09T02:00:37Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - Towards Natural Language-Driven Assembly Using Foundation Models [11.710022685486914]
大規模言語モデル(LLM)と強力な視覚モデルにより、ビジョン・ランゲージ・アクションモデル(英語版)の分野での迅速な研究と開発が可能となった。
本稿では,LLMをベースとしたグローバルコントロールポリシを提案する。
このフレームワークへのLLMの統合は、言語入力の解釈と処理だけでなく、多種多様な複雑なロボット操作のための制御機構の強化においても、その重要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-06-23T12:14:37Z) - A Roadmap Towards Automated and Regulated Robotic Systems [4.6015001632772545]
我々は、AIの非規制生成プロセスが低レベルのタスクに適合していると主張している。
完全自動化・制御されたロボットシステムを実現するためのロードマップを提案する。
論文 参考訳(メタデータ) (2024-03-21T00:14:53Z) - RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis [102.1876259853457]
汎用ロボット行動合成のための木構造多モードコード生成フレームワークRoboCodeXを提案する。
RoboCodeXは、高レベルの人間の命令を複数のオブジェクト中心の操作ユニットに分解する。
概念的および知覚的理解を制御コマンドにマッピングする能力をさらに強化するため、事前学習のための特別なマルチモーダル推論データセットを収集し、教師付き微調整のための反復的自己更新手法を導入する。
論文 参考訳(メタデータ) (2024-02-25T15:31:43Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions
with Large Language Model [63.66204449776262]
Instruct2Actは、ロボット操作タスクのシーケンシャルアクションにマルチモーダル命令をマッピングするフレームワークである。
我々のアプローチは、様々な命令のモダリティや入力タイプを調節する上で、調整可能で柔軟なものである。
我々のゼロショット法は、いくつかのタスクにおいて、最先端の学習ベースのポリシーよりも優れていた。
論文 参考訳(メタデータ) (2023-05-18T17:59:49Z) - ProgPrompt: Generating Situated Robot Task Plans using Large Language
Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。
本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文 参考訳(メタデータ) (2022-09-22T20:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。