論文の概要: WorldEval: World Model as Real-World Robot Policies Evaluator
- arxiv url: http://arxiv.org/abs/2505.19017v1
- Date: Sun, 25 May 2025 07:41:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.83799
- Title: WorldEval: World Model as Real-World Robot Policies Evaluator
- Title(参考訳): WorldEval: 実世界のロボット政策評価ツールとしてのワールドモデル
- Authors: Yaxuan Li, Yichen Zhu, Junjie Wen, Chaomin Shen, Yi Xu,
- Abstract要約: 重要な課題は、ロボットのアクションを忠実に反映した世界モデルから正確なポリシービデオを生成することだ。
本稿では,ビデオ生成モデルをロボットビデオを生成するための潜在動作に従う世界シミュレータに変換するための,シンプルで効果的な手法であるPolyse2Vecを提案する。
次に、実世界のロボットポリシーをオンラインで完全に評価するために設計された、自動パイプラインであるWorldEvalを紹介します。
- 参考スコア(独自算出の注目度): 13.899692171641066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The field of robotics has made significant strides toward developing generalist robot manipulation policies. However, evaluating these policies in real-world scenarios remains time-consuming and challenging, particularly as the number of tasks scales and environmental conditions change. In this work, we demonstrate that world models can serve as a scalable, reproducible, and reliable proxy for real-world robot policy evaluation. A key challenge is generating accurate policy videos from world models that faithfully reflect the robot actions. We observe that directly inputting robot actions or using high-dimensional encoding methods often fails to generate action-following videos. To address this, we propose Policy2Vec, a simple yet effective approach to turn a video generation model into a world simulator that follows latent action to generate the robot video. We then introduce WorldEval, an automated pipeline designed to evaluate real-world robot policies entirely online. WorldEval effectively ranks various robot policies and individual checkpoints within a single policy, and functions as a safety detector to prevent dangerous actions by newly developed robot models. Through comprehensive paired evaluations of manipulation policies in real-world environments, we demonstrate a strong correlation between policy performance in WorldEval and real-world scenarios. Furthermore, our method significantly outperforms popular methods such as real-to-sim approach.
- Abstract(参考訳): ロボット工学の分野は、汎用的なロボット操作ポリシーの開発に向けて大きな進歩を遂げてきた。
しかし、これらの政策を現実のシナリオで評価することは、特にタスクの規模や環境条件が変化するにつれて、時間がかかり、困難なままである。
本研究では,実世界のロボット政策評価において,世界モデルがスケーラブルで再現性があり,信頼性の高いプロキシとして機能することを実証する。
重要な課題は、ロボットのアクションを忠実に反映した世界モデルから正確なポリシービデオを生成することだ。
ロボットのアクションを直接入力したり、高次元のエンコーディング手法を使用すると、アクション追従ビデオの生成に失敗することが多いことを観察する。
そこで本研究では,ロボットビデオを生成するための潜在動作に従う世界シミュレータにビデオ生成モデルを変換する,シンプルかつ効果的な手法であるPolyse2Vecを提案する。
次に、実世界のロボットポリシーをオンラインで完全に評価するために設計された、自動パイプラインであるWorldEvalを紹介します。
WorldEvalは、さまざまなロボットポリシーと個別のチェックポイントを単一のポリシー内で効果的にランク付けし、新たに開発されたロボットモデルによる危険な行動を防ぐための安全検知として機能する。
実世界の環境における操作ポリシーの総合的評価を通じて,WorldEvalにおけるポリシー性能と実世界のシナリオとの間に強い相関関係を示す。
さらに,本手法は,リアルタイム手法などの一般的な手法よりも優れていた。
関連論文リスト
- Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Don't Let Your Robot be Harmful: Responsible Robotic Manipulation [57.70648477564976]
ロボット操作における人間の指示の実行は、深刻な安全性のリスクにつながる可能性がある。
i) 安全リスクを含むシナリオを自動生成し、仮想的なインタラクションを行う世界モデルと、(ii) 反射による結果を予測するメンタルモデルを含む。
本研究は, 安全行政がリスクを回避し, 合成データセットと実世界の両方の実験において, 効率的にタスクを完了できることを実証する。
論文 参考訳(メタデータ) (2024-11-27T12:27:50Z) - GRAPPA: Generalizing and Adapting Robot Policies via Online Agentic Guidance [15.774237279917594]
本稿では,ロボットによる自己指導と自己改善のためのエージェントフレームワークを提案する。
本フレームワークは,環境中の関連オブジェクトに対して,ベースロボットポリシーを反復的に適用する。
弊社のアプローチは、操作ポリシーを効果的にガイドし、成功率を大幅に向上させることを実証する。
論文 参考訳(メタデータ) (2024-10-09T02:00:37Z) - Evaluating Real-World Robot Manipulation Policies in Simulation [91.55267186958892]
実環境と模擬環境の制御と視覚的格差は、信頼性のある模擬評価の鍵となる課題である。
実環境に完全忠実なデジタル双生児を作らなくても、これらのギャップを軽減できる手法を提案する。
シミュレーション環境の集合体であるSIMPLERを作成した。
論文 参考訳(メタデータ) (2024-05-09T17:30:16Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。