論文の概要: Composing Driving Worlds through Disentangled Control for Adversarial Scenario Generation
- arxiv url: http://arxiv.org/abs/2603.12864v1
- Date: Fri, 13 Mar 2026 10:10:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:12.042273
- Title: Composing Driving Worlds through Disentangled Control for Adversarial Scenario Generation
- Title(参考訳): 逆シナリオ生成のためのアンタングル制御による運転世界の構成
- Authors: Yifan Zhan, Zhengqing Chen, Qingjie Wang, Zhuo He, Muyao Niu, Xiaoyang Guo, Wei Yin, Weiqiang Ren, Qian Zhang, Yinqiang Zheng,
- Abstract要約: 自動運転における大きな課題は、安全クリティカルなエッジケースの"ロングテール"である。
交通要因を乱す構成駆動ビデオシミュレータCompoSIAを紹介する。
我々は最先端のベースラインよりも優れた制御可能な生成品質を示す。
- 参考スコア(独自算出の注目度): 40.89741209403581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A major challenge in autonomous driving is the "long tail" of safety-critical edge cases, which often emerge from unusual combinations of common traffic elements. Synthesizing these scenarios is crucial, yet current controllable generative models provide incomplete or entangled guidance, preventing the independent manipulation of scene structure, object identity, and ego actions. We introduce CompoSIA, a compositional driving video simulator that disentangles these traffic factors, enabling fine-grained control over diverse adversarial driving scenarios. To support controllable identity replacement of scene elements, we propose a noise-level identity injection, allowing pose-agnostic identity generation across diverse element poses, all from a single reference image. Furthermore, a hierarchical dual-branch action control mechanism is introduced to improve action controllability. Such disentangled control enables adversarial scenario synthesis-systematically combining safe elements into dangerous configurations that entangled generators cannot produce. Extensive comparisons demonstrate superior controllable generation quality over state-of-the-art baselines, with a 17% improvement in FVD for identity editing and reductions of 30% and 47% in rotation and translation errors for action control. Furthermore, downstream stress-testing reveals substantial planner failures: across editing modalities, the average collision rate of 3s increases by 173%.
- Abstract(参考訳): 自動運転における大きな課題は、安全クリティカルなエッジケースの「長い尾」であり、しばしば共通の交通要素の異常な組み合わせから生じる。
これらのシナリオを合成することは重要であるが、現在の制御可能な生成モデルは不完全または絡み合ったガイダンスを提供し、シーン構造、オブジェクトのアイデンティティ、エゴアクションの独立的な操作を防ぐ。
CompoSIAは、これらの交通要因を分散させ、多様な対向運転シナリオのきめ細かい制御を可能にする構成駆動ビデオシミュレータである。
シーン要素の制御可能なアイデンティティ置換を支援するため,単一参照画像から様々な要素のポーズにまたがるポーズ非依存のアイデンティティ生成が可能なノイズレベルアイデンティティインジェクションを提案する。
さらに、動作制御性を改善するために、階層的なデュアルブランチ動作制御機構を導入する。
このような絡み合った制御は、安全な要素を危険な構成に体系的に組み合わせて、絡み合ったジェネレータが生成できない敵のシナリオを合成することを可能にする。
大規模な比較では、最先端のベースラインよりも制御可能な生成品質が向上し、アイデンティティ編集のためのFVDが17%向上し、動作制御のための回転および翻訳エラーの30%と47%が削減された。
さらに、下流でのストレステストでは、編集モダリティによって3sの平均衝突速度が173%増加するという、プランナーの重大な障害が明らかにされている。
関連論文リスト
- Optimization-Guided Diffusion for Interactive Scene Generation [52.23368750264419]
本稿では,拡散型サンプリングにおける構造的一貫性と相互作用認識を実現するための,最適化誘導型トレーニングフリーフレームワークであるOMEGAを提案する。
OMEGAは生成リアリズム,一貫性,可制御性を向上し,身体的および行動学的に有効なシーンの比率を増大させることを示す。
当社のアプローチでは,3秒未満の時間対コリションで,より近いコリジョンフレームを5ドル(約5,500円)で生成することも可能だ。
論文 参考訳(メタデータ) (2025-12-08T15:56:18Z) - Controllable risk scenario generation from human crash data for autonomous vehicle testing [13.3074428571403]
制御可能なリスクエージェント生成(CRAG)は、支配的な名目的行動と稀な安全クリティカルな行動のモデリングを統合するために設計されたフレームワークである。
CRAGは、正常およびリスク関連挙動を歪め、限られたクラッシュデータの効率的な利用を可能にする構造付き潜在空間を構築する。
論文 参考訳(メタデータ) (2025-11-27T04:53:18Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z) - Optimal Controller Realizations against False Data Injections in Cooperative Driving [2.2134894590368748]
本研究では,False-Data Injection(FDI)攻撃の効果を緩和するためのコントローラ指向アプローチについて検討する。
我々は,新しいが等価なコントローラのクラスがベースコントローラを表現可能であることを示す。
FDI攻撃の影響を最小限に抑えるセンサの最適組み合わせを得る。
論文 参考訳(メタデータ) (2024-04-08T09:53:42Z) - Identifying Systematic Errors in Object Detectors with the SCROD
Pipeline [46.52729366461028]
オブジェクト検出器における系統的エラーの識別と除去は、安全クリティカルなアプリケーションへの展開の前提条件となる。
粒度制御による合成画像の生成により,この制限を克服する。
両手法の強みを組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-23T22:41:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。