論文の概要: When Absolute State Fails: Evaluating Proprioceptive Encodings for Robust Manipulation
- arxiv url: http://arxiv.org/abs/2605.13067v1
- Date: Wed, 13 May 2026 06:41:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.849874
- Title: When Absolute State Fails: Evaluating Proprioceptive Encodings for Robust Manipulation
- Title(参考訳): 絶対状態が失敗した場合:ロバスト操作のための原受容的エンコーディングの評価
- Authors: Maxime Alvarez, Ryo Watanabe, Paul Crook, Afshin Zeinaddini Meymand, Suvin Kurian, Pablo Ferreiro, Genki Sano,
- Abstract要約: 本研究は,ロボットの自己受容状態を符号化し,テスト時の配当性能と配当性能を両立させる手法について検討する。
単純なエピソード単位の相対的フレームは,タスク性能とロバストさのトレードオフとして最適であることがわかった。
- 参考スコア(独自算出の注目度): 0.14990005092937678
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As end-to-end robotic policies are progressively deployed in the real world to solve real tasks, they face a gap between the training and inference conditions. Scaling the amount and diversity of the training data has shown some success in improving zero-shot generalization, yet robots still fail when faced with new, unseen test conditions. For instance, while robots with fixed frames of reference are common, those with moving frames pose a greater challenge for deployment. To address this specific instance of the issue, we present a study of strategies for encoding the robot's proprioceptive state to improve both in- and out-of-distribution performance at test time. Through a systematic study of joint representations, we find that a simple episode-wise relative frame provides the best trade-off between task performance and robustness, outperforming the baselines in extensive real-robot experiments conducted in a realistic test environment. The results suggest a practical path to leveraging data collected by robots with varying frames of reference and deployment to unseen test configurations.
- Abstract(参考訳): エンド・ツー・エンドのロボットポリシーは、実際のタスクを解決するために現実世界に徐々に展開されるので、トレーニングと推論の条件の間にはギャップがある。
トレーニングデータの量と多様性を拡大することで、ゼロショットの一般化を改善することに成功したが、新しい未知のテスト条件に直面したロボットはまだ失敗している。
例えば、固定された参照フレームを持つロボットが一般的であるのに対して、移動フレームを持つロボットはデプロイメントにおいてより大きな課題となる。
この問題の具体例に対処するため,本研究では,ロボットの固有受容状態を符号化し,テスト時の分布内性能と分布外性能を両立させる戦略について検討する。
共同表現の体系的な研究により, 実環境下での大規模な実ロボット実験において, タスク性能とロバスト性との間の最良のトレードオフを, 単純なエピソードワイドな相対的フレームで実現できることが判明した。
その結果,参照や配置の異なるロボットが収集したデータを,見当たらないテスト設定に活用する実践的な方法が示唆された。
関連論文リスト
- Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons [69.87766750714945]
汎用ロボット報酬モデルは通常、専門家によるデモンストレーションから絶対的なタスク進捗を予測するために訓練される。
本稿では、軌道内進行監視と軌道間優先監視を組み合わせたスケーラブルな報酬モデリングフレームワークRobometerを紹介する。
ロビオメーターは、専門家データに報酬等級を固定するフレームレベルのプログレス・ロスと、グローバルな順序制約を課す軌跡比較優先損失という2つの目的で訓練されている。
論文 参考訳(メタデータ) (2026-03-02T17:38:58Z) - Rethinking Visual-Language-Action Model Scaling: Alignment, Mixture, and Regularization [65.37179698521766]
VLA(Vision-Language-Action)モデルは、ジェネラリストロボットの制御を強く約束する。
標準的な「スケールデータ」レシピがロボット工学に翻訳されるかどうかはまだ不明だ。
本稿では,多様なロボットを対象とした事前学習のためのコアトレーニング選択を再考する,VLAスケーリングの体系的かつ制御された研究を提案する。
論文 参考訳(メタデータ) (2026-02-10T12:25:43Z) - RobotArena $\infty$: Scalable Robot Benchmarking via Real-to-Sim Translation [47.79800816696372]
操作ポリシーの現実的なテストは、大規模に労働集約的で、再現が難しい。
既存のシミュレーションベンチマークも同様に制限されており、同じ合成ドメイン内でポリシーをトレーニングおよびテストしている。
本稿では,VLA評価を大規模にシミュレーションした拡張環境に移行することで,これらの課題を克服する新しいベンチマークフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-27T17:41:38Z) - RoboEval: Where Robotic Manipulation Meets Structured and Scalable Evaluation [32.080769025457926]
本稿では,現在の双方向操作ポリシーの限界を明らかにするために,シミュレーションベンチマークと構造化評価フレームワークであるRoboEvalを提案する。
RoboEvalは、空間、物理的、コーディネート機能に体系的に挑戦する、階層化されたセマンティックな基礎付けられた一連のタスクを導入した。
行動メトリクスは、タスクメトリックペアの半数以上の成功と相関し、バイナリ成功が飽和しても情報的であり続ける。
論文 参考訳(メタデータ) (2025-07-01T05:33:16Z) - Curating Demonstrations using Online Experience [52.59275477573012]
また,Demo-SCOREは手作業によるキュレーションを伴わずに,効果的に準最適動作を識別できることが示唆された。
Demo-SCOREは、全てのオリジナルのデモンストレーションで訓練された基本方針と比較して、結果のポリシーにおいて15~35%以上の絶対的な成功率を達成する。
論文 参考訳(メタデータ) (2025-03-05T17:58:16Z) - Contrast Sets for Evaluating Language-Guided Robot Policies [10.105811371008091]
我々は、ロボット工学のコントラストセットを導入して、独立で同一の分散テストインスタンスに対して、小さく、しかし特異な摂動を発生させる。
評価を行おうとする実験者の努力と得られた評価結果との関係について検討する。
我々は、異なるコントラストセットの摂動の相対的な性能変化を利用して、シミュレーション操作タスクと物理ロボット視覚・言語ナビゲーションタスクの両方において、実験者の努力を減らし、ポリシーを特徴づける。
論文 参考訳(メタデータ) (2024-06-19T15:31:21Z) - Robust Policies via Mid-Level Visual Representations: An Experimental
Study in Manipulation and Navigation [115.4071729927011]
エンド・ツー・エンドのRLフレームワークにおいて,中間レベルの視覚表現を汎用的かつ容易に認識可能な知覚状態として用いることの効果について検討した。
一般化を支援し、サンプルの複雑さを改善し、最終的なパフォーマンスを高めることを示します。
実際には、ドメインのランダム化やスクラッチからの学習が失敗したタスクのポリシーをうまくトレーニングするために、中間レベルの表現が使用できる。
論文 参考訳(メタデータ) (2020-11-13T00:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。