論文の概要: AutoMisty: A Multi-Agent LLM Framework for Automated Code Generation in the Misty Social Robot
- arxiv url: http://arxiv.org/abs/2503.06791v1
- Date: Sun, 09 Mar 2025 22:07:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:45:41.345231
- Title: AutoMisty: A Multi-Agent LLM Framework for Automated Code Generation in the Misty Social Robot
- Title(参考訳): AutoMisty: ミスティ社会ロボットにおけるコード生成のためのマルチエージェントLLMフレームワーク
- Authors: Xiao Wang, Lu Dong, Sahana Rangasrinivasan, Ifeoma Nwogu, Srirangaraj Setlur, Venugopal Govindaraju,
- Abstract要約: 大規模言語モデル(LLM)を利用した初のマルチエージェントコラボレーションフレームワークであるAutoMistyを紹介する。
AutoMistyには4つの特別なエージェントモジュールが組み込まれており、タスクの分解、割り当て、問題解決、結果合成を管理している。
AutoMistyの有効性を評価するために,4段階の複雑さにまたがるベンチマークタスクを設計し,実際のMistyロボット環境で実験を行った。
- 参考スコア(独自算出の注目度): 9.893984605439194
- License:
- Abstract: The social robot's open API allows users to customize open-domain interactions. However, it remains inaccessible to those without programming experience. In this work, we introduce AutoMisty, the first multi-agent collaboration framework powered by large language models (LLMs), to enable the seamless generation of executable Misty robot code from natural language instructions. AutoMisty incorporates four specialized agent modules to manage task decomposition, assignment, problem-solving, and result synthesis. Each agent incorporates a two-layer optimization mechanism, with self-reflection for iterative refinement and human-in-the-loop for better alignment with user preferences. AutoMisty ensures a transparent reasoning process, allowing users to iteratively refine tasks through natural language feedback for precise execution. To evaluate AutoMisty's effectiveness, we designed a benchmark task set spanning four levels of complexity and conducted experiments in a real Misty robot environment. Extensive evaluations demonstrate that AutoMisty not only consistently generates high-quality code but also enables precise code control, significantly outperforming direct reasoning with ChatGPT-4o and ChatGPT-o1. All code, optimized APIs, and experimental videos will be publicly released through the webpage: https://wangxiaoshawn.github.io/AutoMisty.html
- Abstract(参考訳): ソーシャルロボットのオープンAPIでは、オープンドメインのインタラクションをカスタマイズすることができる。
しかし、プログラミングの経験のない人にはアクセスできない。
本研究では,大規模言語モデル(LLM)を利用した初のマルチエージェント協調フレームワークであるAutoMistyを紹介し,自然言語命令から実行可能なMistyロボットコードをシームレスに生成できるようにする。
AutoMistyには4つの特別なエージェントモジュールが組み込まれており、タスクの分解、割り当て、問題解決、結果合成を管理している。
各エージェントには2層最適化機構が組み込まれており、反復的な改善のための自己回帰と、ユーザの好みに合わせたヒューマン・イン・ザ・ループが組み込まれている。
AutoMistyは透明な推論プロセスを保証するため、ユーザは自然言語フィードバックを通じてタスクを反復的に洗練し、正確な実行を可能にする。
AutoMistyの有効性を評価するために,4段階の複雑さにまたがるベンチマークタスクを設計し,実際のMistyロボット環境で実験を行った。
大規模な評価は、AutoMistyが一貫して高品質なコードを生成するだけでなく、正確なコード制御を可能にし、ChatGPT-4oやChatGPT-o1による直接推論よりもはるかに優れていることを示している。
すべてのコード、最適化されたAPI、実験的なビデオは、Webページから公開される。
関連論文リスト
- Two Heads Are Better Than One: Collaborative LLM Embodied Agents for Human-Robot Interaction [1.6574413179773757]
大規模言語モデル(LLM)は、自然言語コマンドを解釈するために、その膨大な理解を活用できなければならない。
しかし、これらのモデルは幻覚に悩まされ、安全上の問題やタスクからの逸脱を引き起こす可能性がある。
本研究では、一つの独立したAIエージェントに対して複数のコラボレーティブAIシステムがテストされ、他のドメインの成功が人間とロボットのインタラクション性能の改善につながるかどうかを判定した。
論文 参考訳(メタデータ) (2024-11-23T02:47:12Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - AutoManual: Constructing Instruction Manuals by LLM Agents via Interactive Environmental Learning [11.123256612680906]
LLM(Large Language Models)ベースのエージェントは、さまざまなドメインにわたるタスクを自律的に完了させることを約束している。
我々は,LLMエージェントが対話を通じて理解を自律的に構築し,新しい環境に適応することを可能にするフレームワークであるAutoManualを紹介した。
論文 参考訳(メタデータ) (2024-05-25T14:11:44Z) - VoicePilot: Harnessing LLMs as Speech Interfaces for Physically Assistive Robots [9.528060348251584]
LLM(Large Language Models)を利用した音声インタフェースにより、個人はロボットに高度なコマンドや微妙な好みを伝えることができる。
高度なタスク計画とコード生成のためのロボットへのインタフェースとしてLLMを統合するためのフレームワークが提案されているが、人間中心の考慮を組み込むことはできなかった。
本稿では,身体支援ロボットの音声インタフェースとしてLLMを組み込むための枠組みについて,食事ロボットを用いた3段階の試験を反復的に構築し,11人の高齢者を対象に,独立した生活施設で評価を行った。
論文 参考訳(メタデータ) (2024-04-05T12:45:10Z) - Can Large Language Models Solve Robot Routing? [13.672207504142456]
大規模言語モデル(LLM)は、自然言語で記述されたタスクからロボットルートの生成へとパイプライン全体を置き換えることができる。
単一ロボットとマルチロボットの両方の設定において、8つの変種にまたがる80のユニークなロボットルーティング問題を持つデータセットを構築した。
その結果, 自己検証と自己検証は, 最適性ギャップを著しく低下させることなく, 成功率を高めることが明らかとなった。
論文 参考訳(メタデータ) (2024-03-16T03:54:38Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - ProAgent: From Robotic Process Automation to Agentic Process Automation [87.0555252338361]
LLM(Large Language Models)は、人間のような知性を持つ言語である。
本稿では,ALMをベースとしたエージェントを用いた高度な自動化のための基盤的自動化パラダイムであるエージェントプロセス自動化(APA)を紹介する。
そして、人間の指示を駆使し、特殊エージェントの調整によって複雑な決定を下すように設計されたエージェントであるProAgentをインスタンス化する。
論文 参考訳(メタデータ) (2023-11-02T14:32:16Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。