論文の概要: LA-RCS: LLM-Agent-Based Robot Control System
- arxiv url: http://arxiv.org/abs/2505.18214v1
- Date: Fri, 23 May 2025 00:51:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.211057
- Title: LA-RCS: LLM-Agent-Based Robot Control System
- Title(参考訳): LA-RCS:LLM-Agent-based Robot Control System
- Authors: TaekHyun Park, YoungJun Choi, SeungHoon Shin, Kwangil Lee,
- Abstract要約: LA-RCSは、外部環境を自律的に計画、作業、分析するために設計された高度なロボット制御システムである。
ユーザ要求に基づいて計画を生成し、外部環境を観察し、計画を実行し、外部環境の変化に適応するために必要に応じて計画を変更する。
- 参考スコア(独自算出の注目度): 0.8749675983608172
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LA-RCS (LLM-agent-based robot control system) is a sophisticated robot control system designed to autonomously plan, work, and analyze the external environment based on user requirements by utilizing LLM-Agent. Utilizing a dual-agent framework, LA-RCS generates plans based on user requests, observes the external environment, executes the plans, and modifies the plans as needed to adapt to changes in the external conditions. Additionally, LA-RCS interprets natural language commands by the user and converts them into commands compatible with the robot interface so that the robot can execute tasks and meet user requests properly. During his process, the system autonomously evaluates observation results, provides feedback on the tasks, and executes commands based on real-time environmental monitoring, significantly reducing the need for user intervention in fulfilling requests. We categorized the scenarios that LA-RCS needs to perform into four distinct types and conducted a quantitative assessment of its performance in each scenario. The results showed an average success rate of 90 percent, demonstrating the system capability to fulfill user requests satisfactorily. For more extensive results, readers can visit our project page: https://la-rcs.github.io
- Abstract(参考訳): LA-RCS(LA-RCS、LLM-Adnt-based Robot Control System)は、LLM-Agentを利用して、ユーザ要求に基づいて外部環境を自律的に計画、作業、分析するロボット制御システムである。
二重エージェントフレームワークを利用することで、LA-RCSはユーザ要求に基づいてプランを生成し、外部環境を観察し、計画を実行し、外部環境の変化に適応するために必要に応じて計画を変更する。
さらに、LA-RCSは、ユーザによる自然言語コマンドを解釈し、ロボットインターフェースと互換性のあるコマンドに変換することにより、ロボットがタスクを実行し、ユーザの要求を適切に満たすことができる。
彼のプロセス中、システムは観察結果を自律的に評価し、タスクに対するフィードバックを提供し、リアルタイム環境モニタリングに基づくコマンドを実行する。
LA-RCSが実行するシナリオを4つの異なるタイプに分類し,それぞれのシナリオでそのパフォーマンスを定量的に評価した。
その結果、平均的な成功率は90%となり、ユーザー要求を満足して満たすシステム能力が実証された。
より詳細な結果については、プロジェクトのページを参照してほしい。
関連論文リスト
- ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [54.52092001110694]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたベンチマークである。
ThinkGeoは、ツール-インタラクションのパラダイムにインスパイアされたもので、さまざまな現実世界のアプリケーションにまたがる人間のクエリを含んでいる。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - DeeR-VLA: Dynamic Inference of Multimodal Large Language Models for Efficient Robot Execution [114.61347672265076]
実世界のロボットのためのMLLMの開発は、ロボットプラットフォームで利用可能な計算能力とメモリ容量が典型的に限られているため、難しい。
活性化MLLMのサイズを自動的に調整するロボットビジョンランゲージ・アクション・モデル(DeeR)の動的早期実行フレームワークを提案する。
DeeR は LLM の計算コストを 5.2-6.5x に削減し、GPU のメモリを 2-6x に削減した。
論文 参考訳(メタデータ) (2024-11-04T18:26:08Z) - ControlAgent: Automating Control System Design via Novel Integration of LLM Agents and Domain Expertise [14.14268499543524]
制御系設計は、様々な分野にわたる広範囲の応用を持つ近代工学の重要な側面である。
様々な領域におけるLarge Language Models (LLM) の進歩にもかかわらず、制御系設計におけるそれらの応用は、制御理論の複雑さと特異性のために制限されている。
LLMエージェントと制御指向ドメイン専門知識の新たな統合により制御システム設計を自動化する新しいパラダイムであるControlAgentを紹介する。
論文 参考訳(メタデータ) (2024-10-17T17:42:48Z) - AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - RS-Agent: Automating Remote Sensing Tasks through Intelligent Agent [15.836845304125436]
RS-Agentは、人間のユーザーと対話し、専門的なモデルを自律的に活用するように設計されたAIエージェントである。
RS-Agentは、大きな言語モデルに基づく中央コントローラ、ツール実行のための動的ツールキット、タスク固有のエキスパートガイダンスのためのソリューションスペース、ドメインレベルの推論のための知識スペースの4つの重要なコンポーネントを統合している。
9つのデータセットと18のリモートセンシングタスクにわたる大規模な実験により、RS-Agentは最先端のMLLMよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-06-11T09:30:02Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - InCoRo: In-Context Learning for Robotics Control with Feedback Loops [4.702566749969133]
InCoRoは、LLMコントローラ、シーン理解ユニット、ロボットからなる古典的なロボットフィードバックループを使用するシステムである。
システムの一般化能力を強調し,InCoRoが成功率において先行技術を上回ることを示す。
この研究は、動的環境に適応する信頼性があり、効率的でインテリジェントな自律システムを構築するための道を開いた。
論文 参考訳(メタデータ) (2024-02-07T19:01:11Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。