論文の概要: BadDreamer: Transferable Backdoor Attacks against Video World Models for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2606.21172v1
- Date: Fri, 19 Jun 2026 07:24:32 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:26:10.682083
- Title: BadDreamer: Transferable Backdoor Attacks against Video World Models for Autonomous Driving
- Title(参考訳): BadDreamer: 自動運転のためのビデオワールドモデルに対する移動可能なバックドア攻撃
- Authors: Zhe Shuai, Xiaopeng Xie, Yikun Zeng,
- Abstract要約: ビデオワールドモデルは、未来のシーンの進化を予測するために、自動運転にますます利用されている。
知覚から行動へのパイプラインでは、これらの表現はエゴ軌道ラベルに直接影響を与える。
BadDreamerは、ビデオワールドモデルの学習された遷移ダイナミクスに悪影響を及ぼす。
- 参考スコア(独自算出の注目度): 1.7887848708497243
- License:
- Abstract: Video world models are increasingly used in autonomous driving to forecast future scene evolution and provide future-aware spatio-temporal representations for downstream action prediction. In perception-to-action pipelines, these representations can directly influence ego-vehicle waypoint planning, making the learned future dynamics a critical security-sensitive component. Despite their promise, the training-time security risks of autonomous-driving video world models remain largely unexplored. We present BadDreamer, a transferable spatio-temporal backdoor attack that targets the perception side of this pipeline. Unlike conventional backdoors that manipulate image labels, prompt outputs, or action supervision, BadDreamer poisons the learned transition dynamics of a video world model. It constructs trigger-erasure sequences in which an oncoming yellow delivery rider is visible in the observed context frames but erased from the future frames. After fine-tuning on a small fraction of such sequences, the compromised world model learns a hidden conditional association: when the physical trigger appears, it hallucinates a future where the rider disappears and the road appears clear. We further show that this corrupted future-aware representation can transfer to the downstream action module without directly modifying ego-trajectory labels, inducing unsafe non-evasive waypoint predictions. Our experiments instantiate this attack on a representative open-source perception-to-action pipeline, revealing a representation-level safety risk in autonomous-driving video world models and highlighting the need for backdoor-aware validation beyond clean generation quality.
- Abstract(参考訳): ビデオワールドモデルは、未来のシーンの進化を予測し、下流のアクション予測のための将来認識された時空間表現を提供するために、自律運転にますます利用されている。
知覚から行動へのパイプラインでは、これらの表現はエゴ・車道計画に直接影響を与え、学習された未来を重要なセキュリティに敏感なコンポーネントにする。
彼らの約束にもかかわらず、自動運転ビデオワールドモデルのトレーニング時のセキュリティリスクはほとんど解明されていない。
BadDreamerは、パイプラインの知覚側をターゲットにした、転送可能な時空間バックドアアタックである。
イメージラベル、プロンプトアウトプット、アクションインスペクションを操作する従来のバックドアとは異なり、BadDreamerはビデオワールドモデルの学習された遷移ダイナミクスを悪用する。
観測されたコンテキストフレームには、来るべき黄色のデリバリーライダーが見えるが、将来のフレームから消去されるトリガー・エミッションシーケンスを構成する。
このような少数のシーケンスを微調整した後、妥協された世界モデルは隠れた条件付き関係を学習し、物理的トリガーが現れると、ライダーが消えて道が明確になる未来を幻覚させる。
さらに、この破損した未来認識表現は、エゴ軌道ラベルを直接変更することなく下流行動モジュールに転送でき、安全でない非回避経路予測を誘導できることを示す。
我々の実験は、この攻撃をオープンソースの知覚から行動へのパイプラインに即時化し、自動運転ビデオワールドモデルにおける表現レベルの安全性リスクを明らかにし、クリーンな生成品質を超えたバックドア認識検証の必要性を強調した。
関連論文リスト
- CausalDrive: Real-time Causal World Models for Autonomous Driving [60.66609721457312]
制御可能でリアルタイムなファンデーション駆動の世界であるCausalDriveを紹介します。
CaulDriveは、最初のフロントビューフレーム、エゴ車両の軌道、マクロテキストプロンプトのみで動作する。
本稿では,(1)衝突アーティファクトを著しく緩和した生成的クローズループ評価,(2)ビデオ2Rewardモジュールによる大規模強化学習(RL)後トレーニング,(3)リアルタイムの人間-イン-ザ・ループシミュレーション,の3つのダウンストリームアプリケーションにおける汎用性を実証する。
論文 参考訳(メタデータ) (2026-06-13T15:04:44Z) - FLaRA: Predicting Future Latent Representations for Accident Anticipation [15.994549120609358]
ダッシュカムビデオからの交通事故を予想することは、インテリジェント交通システムにおいて重要な課題である。
事故予知のための潜在表現を予測することで、このパラダイムをシフトさせる新しい予測アーキテクチャであるFLaRAを提案する。
提案手法は,現実的な早期警告機能を維持しつつ,最先端の性能を実現する。
論文 参考訳(メタデータ) (2026-06-12T12:16:45Z) - From Imagined Futures to Executable Actions: Mixture of Latent Actions for Robot Manipulation [88.39072412680633]
将来の映像を実行可能な表現に変換する制御指向インタフェースであるMoLAを提案する。
我々は,シミュレーションベンチマークと実世界のロボット操作タスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2026-05-12T14:15:16Z) - See Tomorrow, Act Today: Foresight-Driven Autonomous Driving [87.02582063534608]
ForeSightは、予測された意思決定として自動運転を再設計する基礎的世界モデル中心の計画フレームワークである。
提案手法は,(1)事前学習された世界モデルを用いて,有望な未来世界を生成すること,(2)これらの未来を前提とした計画行動を行うこと,の2段階からなる。
論文 参考訳(メタデータ) (2026-05-08T03:42:05Z) - LatentPilot: Scene-Aware Vision-and-Language Navigation by Dreaming Ahead with Latent Visual Reasoning [51.969318585152116]
LatentPilotは、トレーニング中の将来の観察を貴重なデータソースとして利用して、アクション条件付きビジュアルダイナミクスを学習する。
そこで本稿では,フライホイール方式のトレーニング機構を提案する。これは,道路上の軌道を反復的に収集し,エージェントの行動分布に適合するようにモデルを再訓練する。
R2R-CE、RxR-CE、R2R-PEベンチマークの実験では新たなSOTA結果が得られた。
論文 参考訳(メタデータ) (2026-03-31T02:21:59Z) - Bridging Scene Generation and Planning: Driving with World Model via Unifying Vision and Motion Representation [66.7879424097418]
We present WorldDrive, a holistic framework that couples scene generation and real-time planning through unified vision and motion representation。
動きの表現、視覚的表現、エゴ状態の間の単純な相互作用は、高品質でマルチモーダルな軌道を生成することができる。
NAVSIM、NAVSIM-v2、nuScenesベンチマークの実験は、WorldDriveが視覚のみの手法で主要な計画性能を達成することを示した。
論文 参考訳(メタデータ) (2026-03-16T07:59:39Z) - ImagiNav: Scalable Embodied Navigation via Generative Visual Prediction and Inverse Dynamics [13.382453086651019]
Vision-Language Navigationは、高価なエンボディメント固有のロボットデータに基づいて訓練されたエンドツーエンドのポリシーに依存している。
ロボットの動作から視覚計画を切り離す新しいモジュラーパラダイムであるImagiNavを提案する。
ImagiNavは、ロボットのデモを必要とせずに、ロボットナビゲーションへの強力なゼロショット転送をデモする。
論文 参考訳(メタデータ) (2026-03-14T08:34:02Z) - Reimagination with Test-time Observation Interventions: Distractor-Robust World Model Predictions for Visual Model Predictive Control [51.14656121641822]
世界モデルは、現在の観測と計画された行動によって、ロボットが将来の観察を「想像」することができる。
新たな視覚的障害は、行動結果の予測を破損させ、ロボットが計画や行動検証のために世界モデルの想像力に依存するとき、下流の障害を引き起こす可能性がある。
本稿では、世界モデルによるより信頼性の高い行動結果の予測を可能にする簡易かつ効果的なテストタイム戦略であるReOI(Reimagination with Observation Intervention)を提案する。
論文 参考訳(メタデータ) (2025-06-19T19:41:29Z) - ProphetDWM: A Driving World Model for Rolling Out Future Actions and Videos [13.630119246378518]
我々は、世界モデルを駆動するには、アクションコントロールとアクション予測の2つの追加能力が必要であると論じる。
ProphetDWMは、未来のビデオやアクションを共同で予測する新しいエンド・ツー・エンドの運転世界モデルである。
論文 参考訳(メタデータ) (2025-05-24T11:35:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。