論文の概要: Direct Preference Optimization-Enhanced Multi-Guided Diffusion Model for Traffic Scenario Generation
- arxiv url: http://arxiv.org/abs/2502.12178v1
- Date: Fri, 14 Feb 2025 05:29:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 14:05:51.708646
- Title: Direct Preference Optimization-Enhanced Multi-Guided Diffusion Model for Traffic Scenario Generation
- Title(参考訳): 交通シナリオ生成のための直接選好最適化によるマルチガイド拡散モデル
- Authors: Seungjun Yu, Kisung Kim, Daejung Kim, Haewook Han, Jinhan Lee,
- Abstract要約: 拡散に基づくモデルは、現実的な交通シナリオを生成するために現実世界の運転データを使用することの有効性が認識されている。
これらのモデルは、特定のトラフィック嗜好を取り入れ、シナリオリアリズムを強化するためにガイド付きサンプリングを採用している。
本稿では,新しいトレーニング戦略を利用して,交通前兆に密着した多誘導拡散モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Diffusion-based models are recognized for their effectiveness in using real-world driving data to generate realistic and diverse traffic scenarios. These models employ guided sampling to incorporate specific traffic preferences and enhance scenario realism. However, guiding the sampling process to conform to traffic rules and preferences can result in deviations from real-world traffic priors and potentially leading to unrealistic behaviors. To address this challenge, we introduce a multi-guided diffusion model that utilizes a novel training strategy to closely adhere to traffic priors, even when employing various combinations of guides. This model adopts a multi-task learning framework, enabling a single diffusion model to process various guide inputs. For increased guided sampling precision, our model is fine-tuned using the Direct Preference Optimization (DPO) algorithm. This algorithm optimizes preferences based on guide scores, effectively navigating the complexities and challenges associated with the expensive and often non-differentiable gradient calculations during the guided sampling fine-tuning process. Evaluated using the nuScenes dataset our model provides a strong baseline for balancing realism, diversity and controllability in the traffic scenario generation.
- Abstract(参考訳): 拡散に基づくモデルは、現実的で多様な交通シナリオを生成するために現実世界の運転データを使用することの有効性が認識されている。
これらのモデルは、特定のトラフィック嗜好を取り入れ、シナリオリアリズムを強化するためにガイド付きサンプリングを採用している。
しかし、サンプリングプロセスをトラフィックルールや嗜好に従うように導くことは、現実のトラフィック先行から逸脱し、非現実的な振る舞いにつながる可能性がある。
この課題に対処するために,様々な組み合わせのガイドを用いた場合であっても,新しいトレーニング戦略を利用して,交通優先事項を忠実に遵守する多誘導拡散モデルを提案する。
このモデルはマルチタスク学習フレームワークを採用し、単一の拡散モデルで様々なガイド入力を処理できる。
サンプリング精度の向上のために,本モデルはDPO(Direct Preference Optimization)アルゴリズムを用いて微調整される。
このアルゴリズムは、ガイドスコアに基づいて好みを最適化し、ガイドされたサンプリング微調整過程において、高価でしばしば微分不可能な勾配計算に関連する複雑さと課題を効果的にナビゲートする。
nuScenesデータセットを用いて評価することで、私たちのモデルは、トラフィックシナリオ生成におけるリアリズム、多様性、コントロール可能性のバランスをとるための強力なベースラインを提供します。
関連論文リスト
- Diffusion Models as Network Optimizers: Explorations and Analysis [71.69869025878856]
生成拡散モデル(GDM)は,ネットワーク最適化の新しいアプローチとして期待されている。
本研究ではまず,生成モデルの本質的な特徴について考察する。
本稿では,識別的ネットワーク最適化よりも生成モデルの利点を簡潔かつ直感的に示す。
論文 参考訳(メタデータ) (2024-11-01T09:05:47Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Models [54.132297393662654]
本稿では,RLによる報酬モデルの最適化により,最先端拡散モデルを微調整するハイブリッド手法を提案する。
我々は、報酬モデルの補間能力を活用し、オフラインデータにおいて最良の設計を上回るアプローチの能力を実証する。
論文 参考訳(メタデータ) (2024-05-30T03:57:29Z) - Sampling for Model Predictive Trajectory Planning in Autonomous Driving using Normalizing Flows [1.2972104025246092]
本稿では,軌道生成のためのサンプリング手法について検討する。
変分推論の分野を起源とする正規化フローが検討される。
学習に基づく正規化フローモデルは、入力領域のより効率的な探索のために訓練される。
論文 参考訳(メタデータ) (2024-04-15T10:45:12Z) - Diffusion-Based Environment-Aware Trajectory Prediction [3.1406146587437904]
自動運転車の安全かつ効率的な運転には、交通参加者の将来の軌跡を予測する能力が不可欠である。
本稿では,多エージェント軌道予測のための拡散モデルを提案する。
このモデルは、交通参加者と環境の間の複雑な相互作用を捉え、データのマルチモーダルな性質を正確に学習することができる。
論文 参考訳(メタデータ) (2024-03-18T10:35:15Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - DICE: Diverse Diffusion Model with Scoring for Trajectory Prediction [7.346307332191997]
本稿では,拡散モデルを用いて将来の軌跡を計算的に効率的に予測するフレームワークを提案する。
提案手法は, 試料軌道数を最大化し, 精度を向上させるための効率的なサンプリング機構である。
本研究では,一般歩行者(UCY/ETH)と自律走行(nuScenes)のベンチマークデータを用いて,経験的評価を行うことによるアプローチの有効性を示す。
論文 参考訳(メタデータ) (2023-10-23T05:04:23Z) - A Diffusion-Model of Joint Interactive Navigation [14.689298253430568]
本稿では,交通シナリオを生成する拡散に基づくDJINNを提案する。
我々のアプローチは、過去、現在、未来からのフレキシブルな状態観察のセットに基づいて、全てのエージェントの軌跡を共同で拡散させる。
本稿では,DJINNが様々な条件分布からの直接的テスト時間サンプリングを柔軟に行う方法を示す。
論文 参考訳(メタデータ) (2023-09-21T22:10:20Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Language-Guided Traffic Simulation via Scene-Level Diffusion [46.47977644226296]
本稿では,シーンレベルの条件拡散モデルであるCTG++について述べる。
まず,現実的で制御可能なトラフィックを生成する時間的バックボーンを備えたシーンレベルの拡散モデルを提案する。
次に、大きな言語モデル(LLM)を用いて、ユーザクエリを、拡散モデルをクエリに準拠した生成に導く損失関数に変換する。
論文 参考訳(メタデータ) (2023-06-10T05:20:30Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。