論文の概要: CAPER: Constrained and Procedural Reasoning for Robotic Scientific Experiments
- arxiv url: http://arxiv.org/abs/2602.09367v1
- Date: Tue, 10 Feb 2026 03:18:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.309693
- Title: CAPER: Constrained and Procedural Reasoning for Robotic Scientific Experiments
- Title(参考訳): CAPER:ロボット科学実験のための制約付き手続き推論
- Authors: Jinghan Yang, Jingyi Hou, Xinbo Yu, Wei He, Yifan Wu,
- Abstract要約: 本稿では,ロボット科学実験のための制約付きおよびプロデューラル推論のためのフレームワークであるCAPERを提案する。
解釈可能な中間表現を通じて手続き的なコミットメントを符号化することにより、CAPERは実験ロジックの実行時違反を防止する。
科学ワークフローベンチマークとパブリックな長期操作データセットの実験は、成功率と手続き的正確性において一貫した改善を示す。
- 参考スコア(独自算出の注目度): 8.099293110920486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic assistance in scientific laboratories requires procedurally correct long-horizon manipulation, reliable execution under limited supervision, and robustness in low-demonstration regimes. Such conditions greatly challenge end-to-end vision-language-action (VLA) models, whose assumptions of recoverable errors and data-driven policy learning often break down in protocol-sensitive experiments. We propose CAPER, a framework for Constrained And ProcEdural Reasoning for robotic scientific experiments, which explicitly restricts where learning and reasoning occur in the planning and control pipeline. Rather than strengthening end-to-end policies, CAPER enforces a responsibility-separated structure: task-level reasoning generates procedurally valid action sequences under explicit constraints, mid-level multimodal grounding realizes subtasks without delegating spatial decision-making to large language models, and low-level control adapts to physical uncertainty via reinforcement learning with minimal demonstrations. By encoding procedural commitments through interpretable intermediate representations, CAPER prevents execution-time violations of experimental logic, improving controllability, robustness, and data efficiency. Experiments on a scientific workflow benchmark and a public long-horizon manipulation dataset demonstrate consistent improvements in success rate and procedural correctness, particularly in low-data and long-horizon settings.
- Abstract(参考訳): 科学実験室でのロボット支援には、手続き的に正しいロングホライゾン操作、限られた監督下での信頼性の高い実行、低デモストレーション体制の堅牢性が必要である。
このような条件は、回復可能なエラーやデータ駆動型ポリシー学習といった仮定をプロトコルに敏感な実験で分解する、エンドツーエンドの視覚言語アクション(VLA)モデルに大きく挑戦する。
本稿では,ロボット科学実験のための制約付きおよびプロクエデュラル推論のためのフレームワークであるCAPERを提案する。
タスクレベルの推論は、明示的な制約の下で手続き的に有効なアクションシーケンスを生成し、中レベルのマルチモーダルグラウンドは、大きな言語モデルに空間的な決定を委譲することなくサブタスクを実現し、低レベルの制御は、最小限のデモンストレーションで強化学習を通じて物理的不確実性に適応する。
解釈可能な中間表現を通じて手続き的なコミットメントを符号化することにより、CAPERは実験ロジックの実行時違反を防止し、制御性、堅牢性、データ効率を改善する。
科学ワークフローベンチマークとパブリックなロングホライズン操作データセットの実験では、特に低データおよびロングホライズン設定において、成功率と手続き的正確性において一貫した改善が示されている。
関連論文リスト
- Let's Reward Step-by-Step: Step-Aware Contrastive Alignment for Vision-Language Navigation in Continuous Environments [38.97818584066075]
VLN-CE(Vision-Language Navigation in Continuous Environments)は、長期にわたる人間のインタラクションから複雑な推論を学ぶためのエージェントである。
現在のトレーニングパラダイムは、一般化能力、エラー回復、トレーニング安定性のバランスをとるのに苦労しています。
本稿では,不完全な軌跡から厳密な監視を抽出するためのフレームワークである,ステップアウェアコントラストアライメント(SACA)を紹介する。
論文 参考訳(メタデータ) (2026-03-10T14:45:50Z) - Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models [7.802379200026965]
認識状態の複雑さに基づいてVLA実行を動的にルーティングする適応型フレームワークを提案する。
我々のアプローチは、VLAの視覚言語バックボーンを、パラメトリックおよび非パラメトリック推定器のアンサンブルに潜伏埋め込みを投影することにより、アクティブな検出ツールに変換する。
論文 参考訳(メタデータ) (2026-03-05T13:14:41Z) - Learning Affordances at Inference-Time for Vision-Language-Action Models [50.93181349331096]
ロボット工学において、VLA(Vision-Language-Action Model)は複雑な制御タスクを解くための有望な道を提供する。
本稿では,VLAの低レベルポリシーを過去の経験を条件とした高レベルVLMに接続するLITEN(Learning from Inference-Time Execution)を紹介する。
提案手法は,低レベルVLAの計画の生成と実行を行う推論フェーズと,その結果を反映した評価フェーズとを反復する。
論文 参考訳(メタデータ) (2025-10-22T16:43:29Z) - CDP: Towards Robust Autoregressive Visuomotor Policy Learning via Causal Diffusion [35.77529453723351]
拡散政策(DP)は、ロボットが行動拡散を通じて専門家のデモンストレーションを模倣することで複雑な行動を学ぶことを可能にする。
本稿では, 過去の行動系列を条件付け, 行動予測を強化するトランスフォーマーに基づく新しい拡散モデルであるCausal Diffusion Policy (CDP)を提案する。
論文 参考訳(メタデータ) (2025-06-17T17:59:12Z) - Do We Need to Verify Step by Step? Rethinking Process Supervision from a Theoretical Perspective [59.61868506896214]
標準的なデータカバレッジの仮定では、強化学習はプロセスの監督よりも統計的に難しいものではない。
任意のポリシーの利点関数が最適なプロセス報酬モデルとして機能することを証明する。
論文 参考訳(メタデータ) (2025-02-14T22:21:56Z) - Diffusion Predictive Control with Constraints [51.91057765703533]
拡散予測制御(Diffusion predictive control with constraints,DPCC)は、拡散に基づく制御のアルゴリズムである。
DPCCは,新しいテスト時間制約を満たすために,既存の手法よりも優れた性能を示すロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。