論文の概要: Ctrl-Crash: Controllable Diffusion for Realistic Car Crashes
- arxiv url: http://arxiv.org/abs/2506.00227v1
- Date: Fri, 30 May 2025 21:04:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:32.514389
- Title: Ctrl-Crash: Controllable Diffusion for Realistic Car Crashes
- Title(参考訳): Ctrl-Crash:リアルカークレーシュの制御可能な拡散
- Authors: Anthony Gosselin, Ge Ya Luo, Luis Lara, Florian Golemo, Derek Nowrouzezahrai, Liam Paull, Alexia Jolicoeur-Martineau, Christopher Pal,
- Abstract要約: Ctrl-Crashはコントロール可能なカークラッシュビデオ生成モデルで、バウンディングボックス、クラッシュタイプ、初期画像フレームなどの信号を条件付けする。
提案手法は,入力の微妙な変化がクラッシュ結果の劇的な変化を引き起こすような,現実的なシナリオ生成を可能にする。
- 参考スコア(独自算出の注目度): 26.71659319735027
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video diffusion techniques have advanced significantly in recent years; however, they struggle to generate realistic imagery of car crashes due to the scarcity of accident events in most driving datasets. Improving traffic safety requires realistic and controllable accident simulations. To tackle the problem, we propose Ctrl-Crash, a controllable car crash video generation model that conditions on signals such as bounding boxes, crash types, and an initial image frame. Our approach enables counterfactual scenario generation where minor variations in input can lead to dramatically different crash outcomes. To support fine-grained control at inference time, we leverage classifier-free guidance with independently tunable scales for each conditioning signal. Ctrl-Crash achieves state-of-the-art performance across quantitative video quality metrics (e.g., FVD and JEDi) and qualitative measurements based on a human-evaluation of physical realism and video quality compared to prior diffusion-based methods.
- Abstract(参考訳): 近年、ビデオ拡散技術は著しく進歩しているが、ほとんどの運転データセットにおける事故イベントの不足により、自動車事故の現実的なイメージを生成するのに苦労している。
交通安全を改善するには、現実的で制御可能な事故シミュレーションが必要である。
そこで本研究では,境界ボックスやクラッシュタイプ,初期画像フレームなどの信号に対して,制御可能なカークラッシュ映像生成モデルであるCtrl-Crashを提案する。
提案手法は,入力の微妙な変化がクラッシュ結果の劇的な変化を引き起こすような,現実的なシナリオ生成を可能にする。
推論時のきめ細かい制御を支援するために,各条件信号に対して独立に調整可能な尺度で分類器なし指導を利用する。
Ctrl-Crashは、定量的ビデオ品質指標(例えば、FVD、JEDi)にまたがる最先端のパフォーマンスと、従来の拡散法と比較して、物理的リアリズムと映像品質の人間的評価に基づく質的な測定を達成している。
関連論文リスト
- Simulating the Unseen: Crash Prediction Must Learn from What Did Not Happen [41.21764593956842]
交通安全科学は長年、基本的なデータパラドックスによって妨げられてきた。
既存のクラッシュ頻度モデルとサロゲート安全指標は、スパース、ノイズ、報告されていない記録に大きく依存している。
ビジョンゼロを達成するためには、従来のクラッシュのみの学習から、新しい形の対実的安全学習へのパラダイムシフトが必要である、と我々は主張する。
論文 参考訳(メタデータ) (2025-05-27T20:33:07Z) - AccidentSim: Generating Physically Realistic Vehicle Collision Videos from Real-World Accident Reports [12.774506031982154]
AccidentSimは、物理的に現実的な衝突ビデオを生成する新しいフレームワークである。
AccidentSimは事故報告の物理的および文脈的な情報から衝突後の車両軌道を再現する。
論文 参考訳(メタデータ) (2025-03-26T15:50:42Z) - NsBM-GAT: A Non-stationary Block Maximum and Graph Attention Framework for General Traffic Crash Risk Prediction [11.444259609536164]
既存の衝突リスク予測モデルは、研究者が危険とみなす仮説上のシナリオに依存している。
ダッシュカムビデオは、個々の車のクレーシュ前動作を撮影するが、周囲の車両の動きに関する重要な情報を欠いていることが多い。
本研究では,車両とその周辺車両間の対話的挙動を捉えるために,新しい非定常極値理論(EVT)を提案する。
論文 参考訳(メタデータ) (2025-03-06T02:12:40Z) - Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Augmenting Ego-Vehicle for Traffic Near-Miss and Accident Classification
Dataset using Manipulating Conditional Style Translation [0.3441021278275805]
事故が起こる前の事故と近距離事故には差はない。
我々の貢献は、事故の定義を再定義し、DADA-2000データセットにおける事故の不整合を再注釈することである。
提案手法は、条件付きスタイル変換(CST)と分離可能な3次元畳み込みニューラルネットワーク(S3D)の2つの異なるコンポーネントを統合する。
論文 参考訳(メタデータ) (2023-01-06T22:04:47Z) - Driving-Signal Aware Full-Body Avatars [49.89791440532946]
そこで本研究では,駆動信号を意識したフルボディアバターを構築するための学習ベース手法を提案する。
我々のモデルは条件付き変分オートエンコーダであり、不完全な駆動信号でアニメーションできる。
仮想テレプレゼンスのためのフルボディアニメーションの課題に対して,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-05-21T16:22:38Z) - Generating and Characterizing Scenarios for Safety Testing of Autonomous
Vehicles [86.9067793493874]
最先端運転シミュレータを用いて,テストシナリオを特徴付け,生成するための効率的なメカニズムを提案する。
次世代シミュレーション(NGSIM)プロジェクトにおける実運転データの特徴付けに本手法を用いる。
事故回避の複雑さに基づいてメトリクスを定義してシナリオをランク付けし、事故発生の可能性を最小限に抑えるための洞察を提供します。
論文 参考訳(メタデータ) (2021-03-12T17:00:23Z) - A model for traffic incident prediction using emergency braking data [77.34726150561087]
道路交通事故予測におけるデータ不足の根本的な課題を、事故の代わりに緊急ブレーキイベントをトレーニングすることで解決します。
メルセデス・ベンツ車両の緊急ブレーキデータに基づくドイツにおける交通事故予測モデルを実装したプロトタイプを提案する。
論文 参考訳(メタデータ) (2021-02-12T18:17:12Z) - Enhanced Transfer Learning for Autonomous Driving with Systematic
Accident Simulation [3.2456691142503256]
シミュレーションデータセット上での伝達学習は、より優れた一般化と衝突回避をもたらすことを示す。
シミュレーションデータに基づいてトレーニングされたモデルから得られた情報は,実世界のデータに基づいてトレーニングされたモデルに推測可能であることを示す。
論文 参考訳(メタデータ) (2020-07-23T17:27:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。