論文の概要: RoboCritics: Enabling Reliable End-to-End LLM Robot Programming through Expert-Informed Critics
- arxiv url: http://arxiv.org/abs/2603.06842v1
- Date: Fri, 06 Mar 2026 20:02:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.012358
- Title: RoboCritics: Enabling Reliable End-to-End LLM Robot Programming through Expert-Informed Critics
- Title(参考訳): RoboCritics:エキスパートインフォームド批評家による信頼性の高いエンドツーエンドLLMロボットプログラミングの実現
- Authors: Callie Y. Kim, Nathan Thomas White, Evan He, Frederic Sala, Bilge Mutlu,
- Abstract要約: 大規模言語モデル(LLM)は、自然言語によるタスク仕様の実現により、ロボットプログラミングの障壁を低くする可能性を秘めている。
本稿では,LLMに基づくロボットプログラミングを専門家インフォームドモーションレベルの批評家によって強化するアプローチであるRoboCriticsを紹介する。
- 参考スコア(独自算出の注目度): 25.430531368529685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: End-user robot programming grants users the flexibility to re-task robots in situ, yet it remains challenging for novices due to the need for specialized robotics knowledge. Large Language Models (LLMs) hold the potential to lower the barrier to robot programming by enabling task specification through natural language. However, current LLM-based approaches generate opaque, "black-box" code that is difficult to verify or debug, creating tangible safety and reliability risks in physical systems. We present RoboCritics, an approach that augments LLM-based robot programming with expert-informed motion-level critics. These critics encode robotics expertise to analyze motion-level execution traces for issues such as joint speed violations, collisions, and unsafe end-effector poses. When violations are detected, critics surface transparent feedback and offer one-click fixes that forward structured messages back to the LLM, enabling iterative refinement while keeping users in the loop. We instantiated RoboCritics in a web-based interface connected to a UR3e robot and evaluated it in a between-subjects user study (n=18). Compared to a baseline LLM interface, RoboCritics reduced safety violations, improved execution quality, and shaped how participants verified and refined their programs. Our findings demonstrate that RoboCritics enables more reliable and user-centered end-to-end robot programming with LLMs.
- Abstract(参考訳): エンドユーザーロボットプログラミングは、ユーザーがその場でロボットを再タスクする柔軟性を与えるが、特殊なロボット工学の知識を必要とするため、初心者にとっては依然として困難である。
大規模言語モデル(LLM)は、自然言語によるタスク仕様の実現により、ロボットプログラミングの障壁を低くする可能性を秘めている。
しかし、現在のLCMベースのアプローチでは、検証やデバッグが難しい不透明な"ブラックボックス"コードを生成し、物理的なシステムにおいて明確な安全性と信頼性のリスクを生み出している。
本稿では,LLMに基づくロボットプログラミングを専門家インフォームドモーションレベルの批評家によって強化するアプローチであるRoboCriticsを紹介する。
これらの批評家はロボット工学の専門知識をエンコードして、共同速度違反、衝突、安全でないエンドエフェクターのポーズなどの問題に対する運動レベルの実行トレースを分析している。
違反が検出された場合、批評家は透明なフィードバックを表面化し、LLMにメッセージを転送するワンクリック修正を提供する。
UR3eロボットに接続したWebベースのインタフェースでRoboCriticsをインスタンス化し,ユーザスタディ(n=18。
ベースラインのLLMインタフェースと比較すると、RoboCriticsは安全違反を減らし、実行品質を改善し、参加者がプログラムを検証し洗練する方法を形作った。
以上の結果から,RoboCriticsはLLMを用いたより信頼性が高く,ユーザ中心のエンドツーエンドのロボットプログラミングを可能にすることが示唆された。
関連論文リスト
- Safety Guardrails for LLM-Enabled Robots [82.0459036717193]
従来のロボット安全アプローチは、大規模言語モデル(LLM)の新たな脆弱性に対処しない
LLM対応ロボットの安全性を確保するための2段ガードレールアーキテクチャであるRoboGuardを提案する。
RoboGuardは、安全プランのパフォーマンスを損なうことなく、安全でないプランの実行を92%から2.5%以下に削減することを示す。
論文 参考訳(メタデータ) (2025-03-10T22:01:56Z) - Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [68.36528819227641]
本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する2つの未目標攻撃目標と,ロボット軌道を操作する目標攻撃目標を導入する。
我々は、カメラの視野に小さなカラフルなパッチを配置し、デジタルと物理の両方の環境で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文 参考訳(メタデータ) (2024-11-18T01:52:20Z) - On the Vulnerability of LLM/VLM-Controlled Robotics [54.57914943017522]
大規模言語モデル(LLM)と視覚言語モデル(VLM)を統合するロボットシステムの脆弱性を,入力モダリティの感度によって強調する。
LLM/VLM制御型2つのロボットシステムにおいて,単純な入力摂動がタスク実行の成功率を22.2%,14.6%減少させることを示す。
論文 参考訳(メタデータ) (2024-02-15T22:01:45Z) - InCoRo: In-Context Learning for Robotics Control with Feedback Loops [4.702566749969133]
InCoRoは、LLMコントローラ、シーン理解ユニット、ロボットからなる古典的なロボットフィードバックループを使用するシステムである。
システムの一般化能力を強調し,InCoRoが成功率において先行技術を上回ることを示す。
この研究は、動的環境に適応する信頼性があり、効率的でインテリジェントな自律システムを構築するための道を開いた。
論文 参考訳(メタデータ) (2024-02-07T19:01:11Z) - REFLECT: Summarizing Robot Experiences for Failure Explanation and
Correction [28.015693808520496]
REFLECTは、ロボットの過去の経験の階層的な要約に基づいて、失敗推論のための大規模言語モデルをクエリするフレームワークである。
本稿では,REFLECTが修正計画の立案に役立てる情報的失敗の説明を生成できることを示す。
論文 参考訳(メタデータ) (2023-06-27T18:03:15Z) - Language to Rewards for Robotic Skill Synthesis [37.21434094015743]
我々は,大規模言語モデル(LLM)を利用して,様々なロボットタスクを最適化し,達成可能な報酬パラメータを定義する新しいパラダイムを提案する。
LLMが生成する中間インタフェースとして報酬を用いることで、ハイレベルな言語命令と修正のギャップを、低レベルなロボット動作に効果的に埋めることができる。
論文 参考訳(メタデータ) (2023-06-14T17:27:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。