論文の概要: ALRM: Agentic LLM for Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2601.19510v2
- Date: Thu, 29 Jan 2026 05:46:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 14:13:19.952897
- Title: ALRM: Agentic LLM for Robotic Manipulation
- Title(参考訳): ALRM:ロボットマニピュレーションのためのエージェントLLM
- Authors: Vitor Gaboardi dos Santos, Ibrahim Khadraoui, Ibrahim Farhat, Hamza Yous, Samy Teffahi, Hakim Hacid,
- Abstract要約: 大規模言語モデル(LLM)は最近、高度な推論と計画能力を示すためにエージェントフレームワークに権限を与えた。
大規模言語モデル(LLM)は最近、高度な推論と計画能力を示すためにエージェントフレームワークに権限を与えた。
- 参考スコア(独自算出の注目度): 3.7473235317736058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have recently empowered agentic frameworks to exhibit advanced reasoning and planning capabilities. However, their integration in robotic control pipelines remains limited in two aspects: (1) prior \ac{llm}-based approaches often lack modular, agentic execution mechanisms, limiting their ability to plan, reflect on outcomes, and revise actions in a closed-loop manner; and (2) existing benchmarks for manipulation tasks focus on low-level control and do not systematically evaluate multistep reasoning and linguistic variation. In this paper, we propose Agentic LLM for Robot Manipulation (ALRM), an LLM-driven agentic framework for robotic manipulation. ALRM integrates policy generation with agentic execution through a ReAct-style reasoning loop, supporting two complementary modes: Code-asPolicy (CaP) for direct executable control code generation, and Tool-as-Policy (TaP) for iterative planning and tool-based action execution. To enable systematic evaluation, we also introduce a novel simulation benchmark comprising 56 tasks across multiple environments, capturing linguistically diverse instructions. Experiments with ten LLMs demonstrate that ALRM provides a scalable, interpretable, and modular approach for bridging natural language reasoning with reliable robotic execution. Results reveal Claude-4.1-Opus as the top closed-source model and Falcon-H1-7B as the top open-source model under CaP.
- Abstract(参考訳): 大規模言語モデル(LLM)は最近、高度な推論と計画能力を示すためにエージェントフレームワークに権限を与えた。
しかし, ロボット制御パイプラインへの統合は, (1) 以前の \ac{llm} ベースのアプローチでは, モジュール性, エージェント的実行機構, 計画能力の制限, 成果の反映, 行動の修正といった2つの側面が欠落しており, (2) 操作タスクの既存のベンチマークは低レベル制御に重点を置いており, マルチステップ推論や言語的バリエーションを体系的に評価していない。
本稿では,ロボット操作のためのエージェントLLM(Agentic LLM for Robot Manipulation, ALRM)を提案する。
ALRMはポリシー生成とReActスタイルの推論ループを通じてエージェント実行を統合し、直接実行可能な制御コード生成のためのCode-asPolicy(CaP)と反復計画とツールベースのアクション実行のためのTool-as-Policy(TaP)の2つの補完モードをサポートする。
また,複数の環境にまたがる56のタスクからなる新しいシミュレーションベンチマークを導入し,言語学的に多様な命令を抽出した。
10個のLLMを用いた実験では、ALRMはスケーラブルで解釈可能でモジュール的なアプローチで、信頼性の高いロボット実行で自然言語推論をブリッジすることを示した。
その結果、Claude-4.1-Opusがトップクローズドソースモデル、Falcon-H1-7Bがトップオープンソースモデルであることが判明した。
関連論文リスト
- RoboInspector: Unveiling the Unreliability of Policy Code for LLM-enabled Robotic Manipulation [7.650053106303868]
大規模言語モデル(LLM)は、推論とコード生成において顕著な能力を示す。
進歩にも拘わらず、信頼性の高いポリシコード生成を実現することは、さまざまな要件のために依然として大きな課題である。
LLM対応ロボット操作におけるポリシーコードの信頼性の欠如を明らかにするパイプラインであるRoboInspectorを紹介する。
論文 参考訳(メタデータ) (2025-08-29T07:47:17Z) - HyCodePolicy: Hybrid Language Controllers for Multimodal Monitoring and Decision in Embodied Agents [6.861838493263133]
HyCodePolicyは、エンボディエージェントのための言語ベースの制御フレームワークである。
コード合成、幾何学的接地、知覚的モニタリング、反復的修復をクローズドループプログラミングサイクルに統合する。
その結果,HyCodePolicyはロボット操作ポリシーの堅牢性とサンプル効率を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2025-08-04T17:18:14Z) - Blueprint First, Model Second: A Framework for Deterministic LLM Workflow [3.9886771197662925]
我々は、"Blueprint First, Model Second"哲学に基づいた新しいパラダイムであるSource Code Agentフレームワークを紹介します。
私たちのフレームワークは、ワークフローロジックを生成モデルから切り離します。
我々の研究は、厳格な手続き論理に支配されるアプリケーションに自律エージェントを検証し、信頼性の高い配置を可能にする。
論文 参考訳(メタデータ) (2025-08-01T03:10:00Z) - Autonomous Control Leveraging LLMs: An Agentic Framework for Next-Generation Industrial Automation [0.0]
本稿では,大規模言語モデル(LLM)を個別のフォールトリカバリ計画と継続的プロセス制御の両方に活用する統合エージェントフレームワークを提案する。
その結果、構造化されたフィードバックとモジュラーエージェントにより、LLMは高レベルな記号計画と低レベルな連続制御を統一できることを示した。
論文 参考訳(メタデータ) (2025-07-03T11:20:22Z) - MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [62.854649499866774]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文 参考訳(メタデータ) (2024-11-26T17:53:44Z) - DynaSaur: Large Language Agents Beyond Predefined Actions [126.98162266986554]
既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作を動的に生成・構成できるLLMエージェントフレームワークを提案する。
このフレームワークでは、汎用プログラミング言語で書かれたプログラムを生成し実行することで、エージェントが環境と対話する。
論文 参考訳(メタデータ) (2024-11-04T02:08:59Z) - Compromising Embodied Agents with Contextual Backdoor Attacks [69.71630408822767]
大型言語モデル(LLM)は、エンボディドインテリジェンスの発展に変化をもたらした。
本稿では,このプロセスにおけるバックドアセキュリティの重大な脅威を明らかにする。
ほんの少しの文脈的デモンストレーションを毒殺しただけで、攻撃者はブラックボックスLDMの文脈的環境を隠蔽することができる。
論文 参考訳(メタデータ) (2024-08-06T01:20:12Z) - DECIDER: A Dual-System Rule-Controllable Decoding Framework for Language Generation [57.07295906718989]
制約付き復号法は,事前訓練された大言語(Ms と PLMs)が生成するテキストの意味やスタイルを,推論時に様々なタスクに対して制御することを目的としている。
これらの方法は、しばしば、欲求的かつ明示的にターゲットを選択することによって、もっともらしい連続を導く。
認知二重プロセス理論に着想を得て,新しい復号化フレームワークDECDERを提案する。
論文 参考訳(メタデータ) (2024-03-04T11:49:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。