Fugu-MT 論文翻訳(概要): DuoBench: A Reproducible Benchmark for Bimanual Manipulation in Simulation and the Real World

論文の概要: DuoBench: A Reproducible Benchmark for Bimanual Manipulation in Simulation and the Real World

arxiv url: http://arxiv.org/abs/2606.11901v1
Date: Wed, 10 Jun 2026 10:28:04 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-11 16:42:38.412032
Title: DuoBench: A Reproducible Benchmark for Bimanual Manipulation in Simulation and the Real World
Title（参考訳）: DuoBench: シミュレーションと実世界におけるバイマニピュレーションのための再現可能なベンチマーク
Authors: Tobias Jülg, Seongjin Bien, Simon Hilber, Yannik Blei, Pierre Krack, Maximilian Li, Sven Parusel, Rudolf Lioutikov, Florian Walter, Wolfram Burgard,
Abstract要約: 双方向ロボットシステムは操作能力を拡大するが、2つのアームを調整することで、制御の複雑さと障害モードが増す。 FR3 Duoプラットフォーム上での双方向操作ポリシのベンチマークフレームワークであるDuoBenchを紹介する。シミュレーションおよび実ハードウェア上での両腕模倣学習と視覚言語行動ポリシーをベンチマークする。
参考スコア（独自算出の注目度）: 15.394993012134316
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Bimanual robot systems substantially expand manipulation capabilities, but coordinating two arms introduces additional control complexity and failure modes that are not well captured by existing benchmarks. We introduce DuoBench, an extensible benchmarking framework for bimanual manipulation policies on the FR3 Duo platform. DuoBench comprises eleven tasks spanning four coordination categories, implemented in simulation and partially reproduced in the real world through reproducible task recipes with 3D-printable assets. In addition, we propose a stage-based evaluation scheme that supports fine-grained semantic failure analysis beyond binary success and provide human-teleoperated datasets for all benchmark tasks. We benchmark several dual-arm imitation-learning and vision-language-action policies in simulation and on real hardware. Our results show that current policies remain challenged by bimanual manipulation, particularly in early interaction stages, parallel arm execution, and transfer between simulation and real-world settings. DuoBench provides a reproducible testbed for diagnosing these failure modes and studying future methods for dual-arm policy learning. Code, datasets, and videos are available at https://duobench.github.io/
Abstract（参考訳）: 双方向ロボットシステムは操作能力を大幅に拡張するが、2つのアームを調整することで、既存のベンチマークではうまく捉えられていない制御の複雑さと障害モードが導入される。 FR3 Duoプラットフォーム上での双方向操作ポリシのための拡張可能なベンチマークフレームワークであるDuoBenchを紹介する。 DuoBenchは4つの調整カテゴリにまたがる11のタスクで構成され、シミュレーションで実装され、3Dプリント可能な資産を持つ再現可能なタスクレシピを通じて、現実世界で部分的に再現される。さらに,二進的成功以上の細粒度のセマンティック障害解析をサポートし,全てのベンチマークタスクに対して人為的に操作されたデータセットを提供するステージベース評価手法を提案する。シミュレーションおよび実ハードウェア上での両腕模倣学習と視覚言語行動ポリシーをベンチマークする。以上の結果から, 初期相互作用, 並列アームの実行, シミュレーションと実世界の設定の移動など, 両面的な操作による現状の政策の課題が残されていることが示唆された。 DuoBenchは、これらの障害モードの診断と、デュアルアームポリシー学習の今後の方法を研究するために再現可能なテストベッドを提供する。コード、データセット、ビデオはhttps://duobench.github.io/で公開されている。

関連論文リスト

SimEval-IR: A Unified Toolkit and Benchmark Suite for Evaluating User Simulators and Search Sessions [1.1105673928718571]
オープンソースのツールキットとベンチマークスイートであるSimEval-IRについて述べる。 SimEval-IR は,(1) セッション検索と対話を統一する標準セッションスキーマ,(2) 行動リアリズム,RATE スタイルの推定によるテスタの信頼性,および2つの言語と4つのシミュレーターファミリーの4つの実データセットのベースライン結果に関する3つのベンチマークを提供する。
論文参考訳（メタデータ） (2026-04-30T13:56:18Z)
Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond [209.35045331678043]
2つの軸に沿って組織された「レベルx法」の分類を導入します。第一に、3つの能力レベルを定義している: 1段階の局所遷移演算子を学ぶL1 Predictor、それらをドメインの法則を尊重する多段階のアクション条件付きロールアウトに構成するL2 Simulator、新しいエビデンスに対して予測が失敗すると自己のモデルを自動で修正するL3 Evolver。我々は400以上の作品を合成し、モデルに基づく強化学習、ビデオ生成、WebおよびGUIエージェント、マルチエージェント社会シミュレーション、AIによる科学的発見にまたがる100以上の代表システムを要約する。
論文参考訳（メタデータ） (2026-04-24T17:48:47Z)
MobileManiBench: Simplifying Model Verification for Mobile Manipulation [70.30578259859512]
MobileManiBenchは、モバイルベースのロボット操作のための大規模なベンチマークである。 MobileManiBenchには、2つのモバイルプラットフォーム(パラレルグリッパーとデキソラスハンドロボット)、2つの同期カメラ(頭と右手首)、630のオブジェクト(オープン、クローズ、プル、プッシュ、ピック)、5つのスキル(オープン、クローズ、プッシュ、ピック)、100以上のタスクが現実的なシーンで実行される。
論文参考訳（メタデータ） (2026-02-05T02:49:52Z)
InternVLA-A1: Unifying Understanding, Generation and Action for Robotic Manipulation [77.07565723756119]
InternVLA-A1は動的予測機能を備えた視覚言語モデルである。我々は、実世界のロボットデータ、合成シミュレーションデータ、人間のビデオなどを用いて、これらのモデルを異種データソース上で事前訓練する。 InternVLA-A1を実世界の12のロボットタスクとシミュレーションベンチマークで評価した。
論文参考訳（メタデータ） (2026-01-05T18:54:29Z)
RoboTwin 2.0: A Scalable Data Generator and Benchmark with Strong Domain Randomization for Robust Bimanual Robotic Manipulation [52.2244588424002]
我々は,多様かつ現実的なデータの自動生成のためのスケーラブルなフレームワークであるRoboTwin 2.0を紹介する。コアとなるRoboTwin-ODは、セマンティックおよび操作関連アノテーションを備えた147カテゴリにわたる771インスタンスのオブジェクトライブラリである。 sim-to-real転送を改善するために、RoboTwin 2.0は5つの軸に沿って構造化された領域ランダム化を適用する。
論文参考訳（メタデータ） (2025-06-22T16:26:53Z)
TeleOpBench: A Simulator-Centric Benchmark for Dual-Arm Dexterous Teleoperation [50.261933845325636]
本稿では,2次元デキスタラス遠隔操作に適したシミュレータ中心のベンチマークであるTeleOpBenchを紹介する。このベンチマークでは、(i)MoCap、(ii)VRデバイス、(iii)腕手外骨格、(iv)単眼視追跡の4つの代表的遠隔操作モードを実装している。
論文参考訳（メタデータ） (2025-05-19T06:08:53Z)
RoboTwin: Dual-Arm Robot Benchmark with Generative Digital Twins (early version) [25.298789781487084]
RoboTwinは、多種多様な専門家データセットを生成するために、3D生成基盤モデルと大規模言語モデルを使用する生成デジタルツインフレームワークである。具体的には、RoboTwinは単一の2D画像からさまざまなデジタルツインを生成し、現実的でインタラクティブなシナリオを生成する。我々のフレームワークはシミュレーションデータと実世界のデータの両方で包括的なベンチマークを提供し、標準化された評価とシミュレーショントレーニングと実世界のパフォーマンスの整合性を向上させる。
論文参考訳（メタデータ） (2024-09-04T17:59:52Z)
PerAct2: Benchmarking and Learning for Robotic Bimanual Manipulation Tasks [32.94163186662167]
両腕間の正確な空間的・時間的調整が要求されるため、両腕の操作は困難である。本稿では,RLBenchを双方向操作に拡張することで,そのギャップを解消する。コードとベンチマークをオープンソース化し、13のタスクと23のユニークなタスクのバリエーションで構成されました。
論文参考訳（メタデータ） (2024-06-29T02:06:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。