論文の概要: Optimization-Guided Diffusion for Interactive Scene Generation
- arxiv url: http://arxiv.org/abs/2512.07661v2
- Date: Thu, 11 Dec 2025 15:08:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 14:11:15.191239
- Title: Optimization-Guided Diffusion for Interactive Scene Generation
- Title(参考訳): 対話型シーン生成のための最適化誘導拡散
- Authors: Shihao Li, Naisheng Ye, Tianyu Li, Kashyap Chitta, Tuo An, Peng Su, Boyang Wang, Haiou Liu, Chen Lv, Hongyang Li,
- Abstract要約: 本稿では,拡散型サンプリングにおける構造的一貫性と相互作用認識を実現するための,最適化誘導型トレーニングフリーフレームワークであるOMEGAを提案する。
OMEGAは生成リアリズム,一貫性,可制御性を向上し,身体的および行動学的に有効なシーンの比率を増大させることを示す。
当社のアプローチでは,3秒未満の時間対コリションで,より近いコリジョンフレームを5ドル(約5,500円)で生成することも可能だ。
- 参考スコア(独自算出の注目度): 52.23368750264419
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Realistic and diverse multi-agent driving scenes are crucial for evaluating autonomous vehicles, but safety-critical events which are essential for this task are rare and underrepresented in driving datasets. Data-driven scene generation offers a low-cost alternative by synthesizing complex traffic behaviors from existing driving logs. However, existing models often lack controllability or yield samples that violate physical or social constraints, limiting their usability. We present OMEGA, an optimization-guided, training-free framework that enforces structural consistency and interaction awareness during diffusion-based sampling from a scene generation model. OMEGA re-anchors each reverse diffusion step via constrained optimization, steering the generation towards physically plausible and behaviorally coherent trajectories. Building on this framework, we formulate ego-attacker interactions as a game-theoretic optimization in the distribution space, approximating Nash equilibria to generate realistic, safety-critical adversarial scenarios. Experiments on nuPlan and Waymo show that OMEGA improves generation realism, consistency, and controllability, increasing the ratio of physically and behaviorally valid scenes from 32.35% to 72.27% for free exploration capabilities, and from 11% to 80% for controllability-focused generation. Our approach can also generate $5\times$ more near-collision frames with a time-to-collision under three seconds while maintaining the overall scene realism.
- Abstract(参考訳): 現実的で多様なマルチエージェント運転シーンは、自動運転車の評価に不可欠であるが、このタスクに不可欠な安全クリティカルな出来事は、データセットを駆動する上ではまれであり、不十分である。
データ駆動シーン生成は、既存の運転ログから複雑な交通挙動を合成することで、低コストな代替手段を提供する。
しかし、既存のモデルには、物理的または社会的制約に反する制御性や利得のサンプルがなく、使用性に制限がある場合が多い。
我々は,シーン生成モデルから拡散に基づくサンプリングを行う際に,構造的一貫性と相互作用の認識を強制する,最適化誘導型,トレーニング不要なフレームワークであるOMEGAを提案する。
OMEGAは、各逆拡散ステップを制約付き最適化によって再アンカーし、生成を物理的に可塑性で行動的に一貫性のある軌道に向けて操る。
この枠組みに基づいて,配信空間におけるゲーム理論の最適化としてエゴ・アタックの相互作用を定式化し,ナッシュ均衡を近似することにより,現実的で安全クリティカルな敵シナリオを生成する。
nuPlanとWaymoの実験では、OMEGAは生成リアリズム、一貫性、制御可能性を改善し、身体的および行動学的に有効なシーンの比率を32.35%から72.27%まで増加させ、制御可能性に焦点を当てた生成では11%から80%に向上している。
われわれのアプローチは、全体のシーンリアリズムを維持しながら、3秒以下で、より近いコリジョンフレームを5ドル(約5,500円)で生成できる。
関連論文リスト
- A Trajectory Generator for High-Density Traffic and Diverse Agent-Interaction Scenarios [37.38654549322757]
本稿では,シナリオ密度を同時に向上し,行動多様性を向上する新しい軌道生成フレームワークを提案する。
本手法は,動作リアリズムとシナリオレベルの安全性を保ちながら,エージェント密度と行動の多様性を著しく改善する。
我々の合成データは下流軌道予測モデルにも有効であり、高密度シナリオに挑戦する際の性能を向上させる。
論文 参考訳(メタデータ) (2025-10-03T00:12:18Z) - World Model-Based End-to-End Scene Generation for Accident Anticipation in Autonomous Driving [1.8277374107085946]
本稿では,生成的拡張シーンと適応的時間的推論を組み合わせた包括的枠組みを提案する。
我々は、高解像度で統計的に一貫した運転シナリオを作成するために、ドメインインフォームドプロンプトによって世界モデルを利用するビデオ生成パイプラインを開発した。
並列に、強化グラフ畳み込みと拡張時間演算子を通して時間関係を符号化する動的予測モデルを構築する。
論文 参考訳(メタデータ) (2025-07-17T03:34:54Z) - RealEngine: Simulating Autonomous Driving in Realistic Context [60.55873455475112]
RealEngineは3Dシーン再構成と新しいビュー合成技術を統合する新しい運転シミュレーションフレームワークである。
実世界のマルチモーダルセンサーデータを活用することで、RealEngineはバックグラウンドシーンとフォアグラウンドトラフィック参加者を別々に再構築し、非常に多様な現実的なトラフィックシナリオを実現する。
RealEngineは、非反応性シミュレーション、安全性テスト、マルチエージェントインタラクションの3つの重要な駆動シミュレーションカテゴリをサポートしている。
論文 参考訳(メタデータ) (2025-05-22T17:01:00Z) - From Imitation to Exploration: End-to-end Autonomous Driving based on World Model [24.578178308010912]
RAMBLEは、意思決定を駆動するエンド・ツー・エンドの世界モデルベースのRL方式である。
複雑な動的トラフィックシナリオを処理できる。
CARLA Leaderboard 1.0では、ルート完了率の最先端のパフォーマンスを達成し、CARLA Leaderboard 2.0では38のシナリオをすべて完了している。
論文 参考訳(メタデータ) (2024-10-03T06:45:59Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。