論文の概要: QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation
- arxiv url: http://arxiv.org/abs/2606.07118v2
- Date: Mon, 08 Jun 2026 03:25:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.069596
- Title: QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation
- Title(参考訳): QuadVerse: 四足歩行シミュレーションのための視覚物理現実性を考慮した統合フレームワーク
- Authors: Yuxiang Chen, Yuanhao Wang, Ziheng Zhang, Meng Zhang, Yu Liu, Yufei Jia, Tiancai Wang, Erjin Zhou, Jin Xie,
- Abstract要約: 映像認識,物理インタラクション,アクチュエータダイナミクスを調整するための校正基板として,再構成シーンを利用する統合フレームワークであるQuadVerseを紹介した。
ここでは,QuadVerseが関連するベースライン上での復元品質と移動追跡を改善したことを示す。
- 参考スコア(独自算出の注目度): 31.92788136725977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simulation is central to robot learning, yet the sim-to-real gap remains a major bottleneck. Existing approaches often tackle visual or dynamic gaps separately, overlooking how these individual mismatches accumulate and propagate throughout the robot's state evolution. In this paper, we introduce QuadVerse, an integrated framework that uses reconstructed scenes as a calibration substrate for aligning visual perception, physical interaction, and actuator dynamics. From captured RGB videos, we reconstruct geometry-constrained 3D Gaussian Splatting (3DGS) scenes that support batched photorealistic ego-view rendering and collision-ready semantic mesh extraction. The meshes further enable contact calibration by initializing spatially varying friction priors and refining them through trajectory-based posterior search. To address remaining actuator discrepancies, QuadVerse trains a residual dynamics compensator by replaying real-world trajectories on the contact-calibrated terrain, reducing the entanglement between terrain-induced contact errors and actuator non-idealities. Experiments show that QuadVerse improves reconstruction quality and locomotion tracking over relevant baselines. Leveraging this foundation, we demonstrate robust zero-shot visual-navigation policy deployment without task-specific real-world rollouts.
- Abstract(参考訳): シミュレーションはロボット学習の中心であるが、シミュレーションと現実のギャップは依然として大きなボトルネックである。
既存のアプローチは、ロボットの状態の進化を通じて、これらの個々のミスマッチがどのように蓄積し伝播するかを見越して、視覚的または動的ギャップに別々に取り組みます。
本稿では,再構成シーンをキャリブレーション基板として利用し,視覚知覚,物理的相互作用,アクチュエータのダイナミクスを調整するためのフレームワークであるQuadVerseを紹介する。
キャプチャしたRGBビデオから、バッチ化されたフォトリアリスティックエゴビューレンダリングと衝突対応セマンティックメッシュ抽出をサポートする幾何学制約付き3Dガウススプラッティング(3DGS)シーンを再構成する。
メッシュはさらに、空間的に変化する摩擦先行を初期化し、軌跡に基づく後部探索によってそれらを精製することにより、接触校正を可能にする。
残りのアクチュエータの相違に対処するため、QuadVerseは、接触校正された地形上の現実世界の軌跡を再生することにより、静止力学補償器を訓練し、地形による接触誤差とアクチュエータ非理想性の間の絡みを低減した。
実験により、QuadVerseは関連するベースライン上での復元品質と移動追跡を改善していることが示された。
この基盤を活用することで、タスク固有の実世界のロールアウトなしで、堅牢なゼロショットビジュアルナビゲーションポリシーの展開を実演します。
関連論文リスト
- GARDEN: Gravity-Aligned Reconstruction of Disentangled ENvironments from RGB images [61.2170105836525]
本稿では,RGBのみのフレームワークを提案する。このフレームワークは,再構成を物理的に地上に配置したシーンファクタ化として再構成し,構造化されたハイブリッドシーン表現を出力する。
結果として得られる表現は、明示的な剛体と分離された背景を組み合わせることで、視覚的リアリズムを維持しながら直接物理シミュレーションを可能にする。
論文 参考訳(メタデータ) (2026-06-02T17:13:01Z) - Physically Grounded 3D Generative Reconstruction under Hand Occlusion using Proprioception and Multi-Contact Touch [3.926587614210279]
そこで本研究では, メカニカル・アモーダル・オブジェクト再構成とポーズ推定のためのマルチモーダル・物理的手法を提案する。
我々は物理的相互作用信号を利用する: プロリオセプションは、ポーズされたハンドジオメトリと、対象表面が横たわらなければならないマルチコンタクトタッチ制約を提供する。
論文 参考訳(メタデータ) (2026-04-10T08:32:51Z) - FunRec: Reconstructing Functional 3D Scenes from Egocentric Interaction Videos [134.8812117202239]
本稿では,エゴセントリックなRGB-Dインタラクションビデオから直接室内シーンの3次元ディジタル双対を再構成するFunRecを提案する。
本研究では,URDF/USDエクスポートのシミュレーション,手指のアベイランスマッピング,ロボットとシーンのインタラクションへの応用を実演する。
論文 参考訳(メタデータ) (2026-04-07T09:22:12Z) - Resonance4D: Frequency-Domain Motion Supervision for Preset-Free Physical Parameter Learning in 4D Dynamic Physical Scene Simulation [53.141181758015186]
Resonance4Dは3次元ガウス散乱と物質点法を結合した物理駆動4次元動的シミュレーションフレームワークである。
我々の重要な洞察は、動的整合性は、相補的領域における共同的拘束運動によって、高密度時間発生なしに強制できるということである。
Resonance4Dは、ピークGPUメモリを35,GB以上から20GB程度に削減しつつ、強力な物理忠実性と運動の整合性を実現する。
論文 参考訳(メタデータ) (2026-04-02T13:00:22Z) - HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions [69.43316445143408]
HSImul3Rはヒトとシーンの相互作用をシミュレーション可能な3次元再構成のための統合フレームワークである。
既存の手法は知覚とシミュレーションのギャップに悩まされており、物理エンジンの不安定性と、具体化されたAIアプリケーションの失敗につながっている。
論文 参考訳(メタデータ) (2026-03-16T17:58:33Z) - Flow4R: Unifying 4D Reconstruction and Tracking with Scene Flow [61.297800738187355]
Flow4Rは、Vision Transformerを用いて、画素当たりのプロパティセット3Dポイント位置、シーンフロー、ポーズウェイト、および2ビュー入力からの信頼度を最小限に予測する。
静的データセットと動的データセットを併用してトレーニングされたFlow4Rは、4D再構築とトラッキングタスクにおける最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-15T06:58:08Z) - Monocular Reconstruction of Neural Tactile Fields [14.002981599280787]
接触時の触覚応答に空間的位置をマッピングする新しい3D表現であるニューラル・触覚場を導入する。
我々のモデルは、単一の単分子RGB画像からこれらの神経触覚場を予測する。
市販のパスプランナーと統合されると、ニューラルな触覚フィールドは、高抵抗オブジェクトを避けるパスを生成することができる。
論文 参考訳(メタデータ) (2026-02-13T01:25:19Z) - 4DRadar-GS: Self-Supervised Dynamic Driving Scene Reconstruction with 4D Radar [15.713470339586058]
動的駆動シーンに適した4次元レーダ拡張型自己教師型3次元再構成フレームワークを提案する。
4DRadar-GSは動的駆動シーン3次元再構成における最先端性能を実現する。
論文 参考訳(メタデータ) (2025-09-16T10:29:43Z) - Reconstructing Interactive 3D Scenes by Panoptic Mapping and CAD Model
Alignments [81.38641691636847]
エンボディエージェントの観点から,シーン再構築の問題を再考する。
rgb-dデータストリームを用いてインタラクティブシーンを再構築する。
この再構成されたシーンは、密集したパノプティカルマップのオブジェクトメッシュを、部分ベースのCADモデルに置き換える。
論文 参考訳(メタデータ) (2021-03-30T05:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。