論文の概要: Decentralized LLM-Driven Coordination of Acoustic Robots for Contactless Object Manipulation
- arxiv url: http://arxiv.org/abs/2605.29378v1
- Date: Thu, 28 May 2026 05:27:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.758124
- Title: Decentralized LLM-Driven Coordination of Acoustic Robots for Contactless Object Manipulation
- Title(参考訳): 無接触物体操作のための音響ロボットの分散LLM駆動コーディネーション
- Authors: Yingying Wang, Narsimlu Kemsaram, Sriram Subramanian,
- Abstract要約: 本稿では,非接触物体操作のための音響ロボットの自然言語駆動協調のための枠組みを提案する。
2つのTurtleBot3ベースの音響ロボットに実装され、それぞれに超音波位相アレーを備えている。
その結果,自然言語コマンドは非接触操作のための分散ロボット動作に変換可能であることがわかった。
- 参考スコア(独自算出の注目度): 5.280275012917872
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Natural language interfaces can simplify interaction with multi-robot systems, especially when non-expert users need to issue high-level commands. Acoustic manipulation using ultrasonic phased arrays also enables contactless object handling for applications such as healthcare, laboratory automation, and precision transport. However, combining large language models (LLMs) with distributed acoustic mobile robots remains underexplored. This paper presents a decentralized framework for natural language-driven coordination of acoustic robots for contactless object manipulation. The system converts spoken instructions into executable multi-robot task plans using Whisper-based speech recognition, LLM-based semantic parsing, structured JSON task representation, and distributed scheduling. The JSON schema encodes robot assignments, temporal dependencies, spatial constraints, and synchronization requirements for sequential, parallel, and synchronized execution. The system is implemented on two TurtleBot3-based acoustic robots, each equipped with an ultrasonic phased array for contactless object transport. Experiments were conducted in three scenarios: sequential execution, parallel multi-robot transport, and synchronized cooperative manipulation. The system achieved task success rates of 96 percent for sequential tasks, 86 percent for parallel execution, and 70 percent for synchronized collaborative transport. These results show that natural language commands can be transformed into distributed robot actions for contactless manipulation, highlighting the potential of LLM-driven automation for human-robot interaction in distributed robotic systems.
- Abstract(参考訳): 自然言語インタフェースはマルチボットシステムとのインタラクションを単純化することができる。
超音波位相アレイを用いた音響操作は、医療、実験室の自動化、精密輸送などの応用のための接触のない物体ハンドリングを可能にする。
しかし,大規模言語モデル (LLMs) と分散音響移動ロボットの組み合わせはいまだ未検討である。
本稿では,非接触物体操作のための音響ロボットの自然言語駆動協調のための分散化フレームワークを提案する。
このシステムは、Whisperベースの音声認識、LLMベースの意味解析、構造化JSONタスク表現、分散スケジューリングを用いて、音声命令を実行可能なマルチロボットタスクプランに変換する。
JSONスキーマは、シーケンシャル、並列、同期実行のためのロボットの割り当て、時間的依存関係、空間的制約、同期要求をエンコードする。
このシステムは2つのTurtleBot3ベースの音響ロボットに実装されており、それぞれに非接触物体輸送用の超音波位相アレーを備えている。
実験は、逐次実行、並列マルチロボット輸送、同期協調操作の3つのシナリオで実施された。
このシステムは、シーケンシャルなタスクで66%、並列実行で66%、同期されたコラボレーティブトランスポートで70%のタスク成功率を達成した。
これらの結果から,自然言語コマンドは非接触操作のための分散ロボット動作に変換可能であり,分散ロボットシステムにおける人間とロボットのインタラクションにおけるLLM駆動の自動化の可能性を強調した。
関連論文リスト
- Heterogeneous Robot Collaboration in Unstructured Environments with Grounded Generative Intelligence [54.91177026001217]
大規模言語モデル(LLM)対応のチーム化手法は、よく構造化された既知の環境を前提とするのが一般的である。
異種ロボットチームにおけるLCMの推論能力を基盤として,これらの制約に対処するフレームワークであるSPINE-HTを提案する。
我々のフレームワークは、従来のLLM対応の不均一なチームリング手法と比較して、ほぼ2倍の成功率を達成する。
論文 参考訳(メタデータ) (2025-10-30T18:24:38Z) - Plantbot: Integrating Plant and Robot through LLM Modular Agent Networks [0.995321385692873]
大規模言語モデル(LLM)モジュールのネットワークを介して,植物と移動ロボットを接続するハイブリッドライフフォームであるPlantbotを紹介した。
各モジュールは非同期に動作し、自然言語を介して通信し、生物学的および人工的なドメイン間のシームレスな相互作用を可能にする。
論文 参考訳(メタデータ) (2025-09-01T14:12:28Z) - COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.24666980374751]
COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。
提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。
実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-23T15:53:41Z) - Enhancing the LLM-Based Robot Manipulation Through Human-Robot Collaboration [4.2460673279562755]
大規模言語モデル(LLM)はロボット工学の分野で人気を集めている。
本稿では,人間ロボットコラボレーション(HRC)によるLLMに基づく自律操作の性能向上のための新しいアプローチを提案する。
このアプローチでは、高レベルの言語コマンドをロボットによって実行できる一連の動作に分解するために、引き起こされたGPT-4言語モデルを使用する。
論文 参考訳(メタデータ) (2024-06-20T08:23:49Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Language to Rewards for Robotic Skill Synthesis [37.21434094015743]
我々は,大規模言語モデル(LLM)を利用して,様々なロボットタスクを最適化し,達成可能な報酬パラメータを定義する新しいパラダイムを提案する。
LLMが生成する中間インタフェースとして報酬を用いることで、ハイレベルな言語命令と修正のギャップを、低レベルなロボット動作に効果的に埋めることができる。
論文 参考訳(メタデータ) (2023-06-14T17:27:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。