論文の概要: Dreaming the Unseen: World Model-regularized Diffusion Policy for Out-of-Distribution Robustness
- arxiv url: http://arxiv.org/abs/2603.21017v1
- Date: Sun, 22 Mar 2026 02:30:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.195781
- Title: Dreaming the Unseen: World Model-regularized Diffusion Policy for Out-of-Distribution Robustness
- Title(参考訳): 夢見る:世界モデル正規化拡散政策のアウト・オブ・ディストリビューション・ロバスト性
- Authors: Ziou Hu, Xiangtong Yao, Yuan Meng, Zhenshan Bing, Alois Knoll,
- Abstract要約: 拡散政策は、ビジュモーター制御において優れるが、しばしば重度のアウト・オブ・ディストリビューション障害の下で破滅的に失敗する。
本稿では,DDP(Dream Diffusion Policy)について紹介する。DDPは,拡散世界モデルを,共有3次元ビジュアルエンコーダを介して,政策の学習目標に統合するフレームワークである。
DDPは、推定中に突然のOOD異常を検出し、破損した視覚ストリームを積極的に放棄する。
内部の「想像」に頼って破壊を安全に回避し、物理的現実に順応する前に想像上の軌道を発生させる。
- 参考スコア(独自算出の注目度): 37.769479036520714
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion policies excel at visuomotor control but often fail catastrophically under severe out-of-distribution (OOD) disturbances, such as unexpected object displacements or visual corruptions. To address this vulnerability, we introduce the Dream Diffusion Policy (DDP), a framework that deeply integrates a diffusion world model into the policy's training objective via a shared 3D visual encoder. This co-optimization endows the policy with robust state-prediction capabilities. When encountering sudden OOD anomalies during inference, DDP detects the real-imagination discrepancy and actively abandons the corrupted visual stream. Instead, it relies on its internal "imagination" (autoregressively forecasted latent dynamics) to safely bypass the disruption, generating imagined trajectories before smoothly realigning with physical reality. Extensive evaluations demonstrate DDP's exceptional resilience. Notably, DDP achieves a 73.8% OOD success rate on MetaWorld (vs. 23.9% without predictive imagination) and an 83.3% success rate under severe real-world spatial shifts (vs. 3.3% without predictive imagination). Furthermore, as a stress test, DDP maintains a 76.7% real-world success rate even when relying entirely on open-loop imagination post-initialization.
- Abstract(参考訳): 拡散政策は、振動子制御において優れるが、予期せぬ物体の変位や視覚的腐敗など、深刻なアウト・オブ・ディストリビューション(OOD)障害の下で破滅的に失敗することが多い。
この脆弱性に対処するため,我々はDream Diffusion Policy (DDP)を導入し,拡散世界モデルを共有3Dビジュアルエンコーダを介して,政策のトレーニング目標に深く統合するフレームワークを提案する。
この共同最適化は、堅牢な状態予測機能を備えたポリシーを付与する。
推測中に突然のOOD異常に遭遇すると、DDPは実像差を検出し、破損した視覚ストリームを積極的に放棄する。
その代わりに、内部の「想像」(自己回帰的に予測された潜在力学)に頼って破壊を安全に回避し、物理的現実をスムーズに認識する前に想像上の軌道を生成する。
広範囲な評価は、DDPの例外的な弾力性を示している。
特に、DDPはMetaWorldで73.8%のOOD成功率(V. 23.9%は予測的想像力なしで)を達成し、83.3%は厳しい現実空間シフト(v. 3.3%は予測的想像力なしで)で成功率を達成した。
さらに、ストレステストとして、DDPは、オープンループの想像力に完全に依存しても、76.7%の実際の成功率を維持している。
関連論文リスト
- 6DAttack: Backdoor Attacks in the 6DoF Pose Estimation [15.592520435073602]
6DoFのポーズ推定は、ロボット工学、AR/VR、自律システムで広く使われている。
バックドア攻撃は重大なセキュリティリスクを引き起こす。
本稿では,3次元オブジェクトトリガを用いた誤ったポーズを誘発するフレームワークである6DAttackを提案する。
論文 参考訳(メタデータ) (2025-12-22T05:49:57Z) - Percept-WAM: Perception-Enhanced World-Awareness-Action Model for Robust End-to-End Autonomous Driving [48.512353531499286]
本稿では,視覚言語モデル(VLM)に2D/3Dシーン理解能力を暗黙的に統合した知覚強調世界認識行動モデルPercept-WAMを紹介する。
我々は,高密度物体知覚のためのグリッド条件付き予測機構を提案し,IoU対応スコアリングと並列自己回帰デコードを導入し,長距離・遠距離・小対象シナリオの安定性を向上させる。
実験により、パーセプションWAMは下流の知覚ベンチマークで古典的な検出器やセグメンタと一致し、2D検出とBEV 3D検出で51.7/58.9 mAPを達成した。
論文 参考訳(メタデータ) (2025-11-24T15:28:25Z) - Out-of-Distribution Semantic Occupancy Prediction [26.178096447889605]
本稿では,3次元ボクセル空間におけるOoD検出をターゲットとした,アウト・オブ・ディストリビューション・セマンティック・アクシデンシー予測を提案する。
OccOoDは,OoD検出をVoxel-BEVプログレッシブフュージョン(VBPF)を用いた3次元セマンティック占有予測に統合する新しいフレームワークである。
実験の結果、OccOoDはAuROC67.34%、AuPRCr29.21%で最先端のOoD検出を実現し、競合占有率予測性能を維持した。
論文 参考訳(メタデータ) (2025-06-26T12:44:29Z) - LanEvil: Benchmarking the Robustness of Lane Detection to Environmental Illusions [61.87108000328186]
レーン検出(LD)は自律走行システムにおいて不可欠な要素であり、適応型クルーズ制御や自動車線センターなどの基本的な機能を提供している。
既存のLDベンチマークは主に、環境錯覚に対するLDモデルの堅牢性を無視し、一般的なケースを評価することに焦点を当てている。
本稿では、LDに対する環境錯覚による潜在的な脅威について検討し、LanEvilの最初の総合ベンチマークを確立する。
論文 参考訳(メタデータ) (2024-06-03T02:12:27Z) - Robo3D: Towards Robust and Reliable 3D Perception against Corruptions [58.306694836881235]
我々は,3次元検出器とセグメンタのロバスト性を,アウト・オブ・ディストリビューションのシナリオで検証するための,最初の総合的なベンチマークであるRobo3Dを紹介する。
気象条件の悪化,外乱,センサの故障などに起因する8種類の汚職について検討した。
本稿では,モデルレジリエンスを高めるための簡易なフレキシブルなボキセル化戦略とともに,密度に敏感なトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T17:59:17Z) - Evaluating the Robustness of Semantic Segmentation for Autonomous
Driving against Real-World Adversarial Patch Attacks [62.87459235819762]
自動運転車のような現実のシナリオでは、現実の敵例(RWAE)にもっと注意を払わなければならない。
本稿では,デジタルおよび実世界の敵対パッチの効果を検証し,一般的なSSモデルのロバスト性を詳細に評価する。
論文 参考訳(メタデータ) (2021-08-13T11:49:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。