論文の概要: Task-Aware Positioning for Improvisational Tasks in Mobile Construction Robots via an AI Agent with Multi-LMM Modules
- arxiv url: http://arxiv.org/abs/2603.22903v1
- Date: Tue, 24 Mar 2026 07:51:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.36608
- Title: Task-Aware Positioning for Improvisational Tasks in Mobile Construction Robots via an AI Agent with Multi-LMM Modules
- Title(参考訳): マルチLMMモジュールを用いたAIエージェントによる移動ロボットのタスク認識位置決め
- Authors: Seongju Jang, Francis Baek, SangHyun Lee,
- Abstract要約: 本稿では,自然言語で与えられた即興的なタスクを理解し,タスク要求位置を特定し,それ自身を位置決めするエージェントを提案する。
このエージェントは四足歩行ロボットで実装され、タスク要求位置の特定と位置決めで92.2%の成功率を達成した。
本研究では,モバイル建設ロボットが非既定タスクを自律的に実行できるようにする。
- 参考スコア(独自算出の注目度): 9.548161172036624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the ever-changing nature of construction, many tasks on sites occur in an improvisational manner. Existing mobile construction robot studies remain limited in addressing improvisational tasks, where task-required locations, timing of task occurrence, and contextual information required for task execution are not known in advance. We propose an agent that understands improvisational tasks given in natural language, identifies the task-required location, and positions itself. The agent's functionality was decomposed into three Large Multimodal Model (LMM) modules operating in parallel, enabling the application of LMMs for task interpretation and breakdown, construction drawing-based navigation, and visual reasoning to identify non-predefined task-required locations. The agent was implemented with a quadruped robot and achieved a 92.2% success rate for identifying and positioning at task-required locations across three tests designed to assess improvisational task handling. This study enables mobile construction robots to perform non-predefined tasks autonomously.
- Abstract(参考訳): 建設の変化する性質のため、現場での多くの作業は即興的に行われる。
既存のモバイル建設ロボットの研究は、タスク要求された場所、タスク発生のタイミング、タスク実行に必要なコンテキスト情報が事前に分かっていない即興的なタスクに対処するのに限られている。
本稿では,自然言語で与えられた即興的なタスクを理解し,タスク要求位置を特定し,それ自身を位置決めするエージェントを提案する。
エージェントの機能は3つの大規模マルチモーダルモデル(LMM)モジュールに並列に分割され、タスクの解釈と分解、構築図面に基づくナビゲーション、未定義のタスク要求位置を特定する視覚的推論にLMMを適用できるようになった。
このエージェントは四足歩行ロボットで実装され、即興的なタスクハンドリングを評価するために設計された3つのテストにおいて、タスク要求位置の特定と位置決めに92.2%の成功率を達成した。
本研究では,モバイル建設ロボットが非既定タスクを自律的に実行できるようにする。
関連論文リスト
- HELP: Hierarchical Embodied Language Planner for Household Tasks [75.38606213726906]
複雑なシナリオを扱うエージェントは、堅牢な計画能力に大きく依存する。
広範な言語知識を備えた大規模言語モデルは、この役割を果たすことができる。
LLMをベースとした一組のエージェントからなる階層型エンボディード言語プランナーHELPを提案する。
論文 参考訳(メタデータ) (2025-12-25T15:54:08Z) - Multi-Robot Task Planning for Multi-Object Retrieval Tasks with Distributed On-Site Knowledge via Large Language Models [6.0783502693642495]
「リンゴとバナナを合わせる」や「遠足の準備をする」といった指示を効率的に実行することが不可欠である。
本研究では,各ロボットが異なる状況下での知識を持つ場合,どのロボットをタスクのどの部分に割り当てるべきかを決定するという課題に対処する。
本稿では,大規模言語モデル(LLM)と空間概念を利用して,自然言語命令をサブタスクに分解するタスク計画フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-16T09:00:25Z) - LLM-Empowered Embodied Agent for Memory-Augmented Task Planning in Household Robotics [7.274730603514222]
自律型家庭用オブジェクト管理のためのLLM駆動型エージェントオーケストレーションアーキテクチャを具現化したロボットシステムを提案する。
このシステムはメモリ拡張タスク計画を統合し、過去の動作を追跡しながらロボットがハイレベルなユーザーコマンドを実行できるようにする。
論文 参考訳(メタデータ) (2025-04-30T15:00:20Z) - REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation [57.628771707989166]
本稿では,ReMACと呼ばれる適応型マルチエージェント計画フレームワークを提案する。
ReMACには2つの重要なモジュールが組み込まれており、ループ内で事前条件と後条件チェックを実行し、進捗と計画の洗練を評価する。
論文 参考訳(メタデータ) (2025-03-28T03:51:40Z) - WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [85.95607119635102]
大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-07T07:15:49Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - Language-guided Task Adaptation for Imitation Learning [40.1007184209417]
本稿では,自然言語でコミュニケーションするタスク間の差異を指標として,関連するタスクのデモンストレーションからタスクを学習する,新たな設定を提案する。
提案した設定では、低労力の言語記述を提供することで、他のタスクからのデモを再利用することができ、エージェントエラーの修正にフィードバックを提供することもできる。
論文 参考訳(メタデータ) (2023-01-24T00:56:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。