論文の概要: DeeAD: Dynamic Early Exit of Vision-Language Action for Efficient Autonomous Driving
- arxiv url: http://arxiv.org/abs/2511.20720v1
- Date: Tue, 25 Nov 2025 07:00:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:58.78762
- Title: DeeAD: Dynamic Early Exit of Vision-Language Action for Efficient Autonomous Driving
- Title(参考訳): DeeAD:効率的な自律運転のためのビジョンランゲージ動作の動的早期実行
- Authors: Haibo HU, Lianming Huang, Nan Guan, Chun Jason Xue,
- Abstract要約: Vision-Language Action (VLA) は、認識、推論、軌道生成を自律運転に統一するが、深いトランスフォーマースタックによる大きな推論遅延に悩まされる。
トレーニング不要で行動誘導型早期退避型フレームワークであるDeeADについて,中間軌道の物理的実現可能性を評価することにより,VLA計画の高速化を図る。
Bench2Driveベンチマークの実験では、計画品質と安全性を保ちながら、28%のトランスフォーマー層幅と29%のレイテンシ削減が示されている。
- 参考スコア(独自算出の注目度): 20.235153433297384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-Language Action (VLA) models unify perception, reasoning, and trajectory generation for autonomous driving, but suffer from significant inference latency due to deep transformer stacks. We present DeeAD, a training-free, action-guided early-exit framework that accelerates VLA planning by evaluating the physical feasibility of intermediate trajectories. Instead of relying on confidence scores, DeeAD terminates inference when predicted trajectories align with lightweight planning priors (e.g., Navigation or Low-precision Planning) within a tolerable deviation (<2m). To improve efficiency, we introduce a multi-hop controller that adaptively skips redundant layers based on the change rate of scores. DeeAD integrates into existing VLA models, such as ORION, without requiring retraining. Experiments on the Bench2Drive benchmark demonstrate up to 28% transformer-layer sparsity and 29% latency reduction, while preserving planning quality and safety.
- Abstract(参考訳): Vision-Language Action (VLA) は、認識、推論、軌道生成を自律運転に統一するが、深いトランスフォーマースタックによる大きな推論遅延に悩まされる。
トレーニング不要で行動誘導型早期退避型フレームワークであるDeeADについて,中間軌道の物理的実現可能性を評価することにより,VLA計画の高速化を図る。
信頼性スコアに頼る代わりに、DeeADは、予測された軌道が、許容可能な偏差 (2m) の中で、軽量な計画事前(例えば、ナビゲーションまたは低精度計画)と整合すると、推論を終了する。
効率を向上させるために、スコアの変化率に基づいて冗長層を適応的にスキップするマルチホップコントローラを導入する。
DeeADは、ORIONのような既存のVLAモデルに統合される。
Bench2Driveベンチマークの実験では、計画品質と安全性を保ちながら、28%のトランスフォーマー層幅と29%のレイテンシ削減が示されている。
関連論文リスト
- DAP: A Discrete-token Autoregressive Planner for Autonomous Driving [34.32497598431514]
本稿では,BEVのセマンティクスとエゴの軌跡を共同で予測する離散的な自己回帰プランナであるDAPを紹介する。
我々は、報酬誘導改善を注入しながら、教師付き行動クローンを保存できる強化学習に基づく微調整を取り入れた。
DAPは、オープンループメトリクスの最先端のパフォーマンスを達成し、NAVSIMベンチマークで競合するクローズループ結果を提供する。
論文 参考訳(メタデータ) (2025-11-17T12:31:33Z) - SP-VLA: A Joint Model Scheduling and Token Pruning Approach for VLA Model Acceleration [70.72227437717467]
VLA(Vision-Language-Action)モデルは、その強力な制御能力に注目が集まっている。
計算コストが高く、実行頻度も低いため、ロボット操作や自律ナビゲーションといったリアルタイムタスクには適さない。
本稿では,共同スケジューリングモデルとプルーニングトークンにより,VLAモデルを高速化する統一フレームワークSP-VLAを提案する。
論文 参考訳(メタデータ) (2025-06-15T05:04:17Z) - Variable Time-Step MPC for Agile Multi-Rotor UAV Interception of Dynamic Targets [6.0967385124149756]
既存の非線形モデル予測制御手法を使用したアジャイルプランニングは、ますます需要が高まるにつれて計画手順の数によって制限される。
本稿では,変動時間ステップを導入し,予測水平長と組み合わせることで,これらの制約に対処することを提案する。
簡易な点質量運動プリミティブは、四重項力学の微分平坦性と、平坦な出力空間における可能な軌道の軌道生成を利用するために用いられる。
論文 参考訳(メタデータ) (2025-03-18T11:59:24Z) - AdaShadow: Responsive Test-time Model Adaptation in Non-stationary Mobile Environments [24.606016498430407]
本稿では,非定常移動データ配信と資源動態のための応答性テスト時間適応フレームワークであるAdaShadowを提案する。
AdaShadowは、レイヤの重要度とレイテンシを推定する上での課題と、最適なレイヤ更新計画のスケジューリングに対処する。
その結果,AdaShadowは連続的なシフトの下で最高の精度-遅延バランスを達成することがわかった。
論文 参考訳(メタデータ) (2024-10-10T16:41:39Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。