論文の概要: Software-Hardware Co-optimization for Modular E2E AV Paradigm: A Unified Framework of Optimization Approaches, Simulation Environment and Evaluation Metrics
- arxiv url: http://arxiv.org/abs/2601.07393v1
- Date: Mon, 12 Jan 2026 10:22:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.335136
- Title: Software-Hardware Co-optimization for Modular E2E AV Paradigm: A Unified Framework of Optimization Approaches, Simulation Environment and Evaluation Metrics
- Title(参考訳): モジュール型E2E AVパラダイムのためのソフトウェア-ハードウェア共同最適化:最適化アプローチ,シミュレーション環境,評価指標の統一フレームワーク
- Authors: Chengzhi Ji, Xingfeng Li, Zhaodong Lv, Hao Sun, Pan Liu, Hao Frank Yang, Ziyuan Pu,
- Abstract要約: 本稿では,ME2E自律運転推論のための再利用可能なソフトウェアとハードウェアの共同最適化およびクローズドループ評価フレームワークを提案する。
提案フレームワークは,推定遅延とエネルギー消費を大幅に低減しつつ,ベースラインレベルの駆動性能を維持する。
- 参考スコア(独自算出の注目度): 21.03304462504213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modular end-to-end (ME2E) autonomous driving paradigms combine modular interpretability with global optimization capability and have demonstrated strong performance. However, existing studies mainly focus on accuracy improvement, while critical system-level factors such as inference latency and energy consumption are often overlooked, resulting in increasingly complex model designs that hinder practical deployment. Prior efforts on model compression and acceleration typically optimize either the software or hardware side in isolation. Software-only optimization cannot fundamentally remove intermediate tensor access and operator scheduling overheads, whereas hardware-only optimization is constrained by model structure and precision. As a result, the real-world benefits of such optimizations are often limited. To address these challenges, this paper proposes a reusable software and hardware co-optimization and closed-loop evaluation framework for ME2E autonomous driving inference. The framework jointly integrates software-level model optimization with hardware-level computation optimization under a unified system-level objective. In addition, a multidimensional evaluation metric is introduced to assess system performance by jointly considering safety, comfort, efficiency, latency, and energy, enabling quantitative comparison of different optimization strategies. Experiments across multiple ME2E autonomous driving stacks show that the proposed framework preserves baseline-level driving performance while significantly reducing inference latency and energy consumption, achieving substantial overall system-level improvements. These results demonstrate that the proposed framework provides practical and actionable guidance for efficient deployment of ME2E autonomous driving systems.
- Abstract(参考訳): モジュラー・エンド・ツー・エンド(ME2E)自律運転パラダイムは、モジュラー解釈可能性とグローバル最適化能力を組み合わせたものであり、強力な性能を示している。
しかし、既存の研究は主に精度の向上に重点を置いており、推論遅延やエネルギー消費といったシステムレベルの重要な要因は見過ごされがちである。
モデル圧縮とアクセラレーションに対する以前の取り組みは、通常、ソフトウェアまたはハードウェアのどちらかを独立して最適化する。
ソフトウェアのみの最適化は、中間テンソルアクセスと演算子スケジューリングオーバーヘッドを根本的に除去することはできないが、ハードウェアのみの最適化はモデル構造と精度によって制約される。
結果として、そのような最適化の現実的な利点は、しばしば制限される。
これらの課題に対処するために,ME2E自律運転推論のための再利用可能なソフトウェアとハードウェアの共同最適化およびクローズドループ評価フレームワークを提案する。
このフレームワークは、統合されたシステムレベルの目的の下で、ソフトウェアレベルのモデル最適化とハードウェアレベルの計算最適化を共同で統合する。
さらに, 安全性, 快適性, 効率, レイテンシ, エネルギーを共同で考慮し, システム性能を評価するための多次元評価指標を導入し, 最適化戦略の定量的比較を可能にする。
複数のME2E自律運転スタックを対象とした実験により,提案フレームワークは推定遅延とエネルギー消費を大幅に低減し,システムレベルの大幅な改善を実現するとともに,ベースラインレベルの運転性能を保った。
これらの結果から,ME2E自動運転システムの効率的な展開のための実用的で実用的なガイダンスが提案されている。
関連論文リスト
- Relation-Aware Bayesian Optimization of DBMS Configurations Guided by Affinity Scores [2.474203056060563]
データベース管理システム(DBMS)は,大規模および異種データの管理に基本的であり,その性能は構成パラメータの影響を強く受けている。
近年の研究では、機械学習を用いた自動構成最適化に焦点が当てられているが、既存のアプローチにはいくつかの重要な制限がある。
パラメータ依存をグラフとして表現する新しいフレームワークであるRelTuneを提案し,パフォーマンス関連セマンティクスを符号化したGNNベースの潜伏埋め込みを学習する。
論文 参考訳(メタデータ) (2025-10-31T03:46:42Z) - AwareCompiler: Agentic Context-Aware Compiler Optimization via a Synergistic Knowledge-Data Driven Framework [42.57224438231615]
本稿では,コンパイラ最適化のためのエージェントフレームワークである textbfAwareCompiler を紹介する。
構造化知識統合とデータセット構築、知識駆動適応パス生成、データ駆動ハイブリッドトレーニングパイプラインの3つの重要なイノベーション。
標準ベンチマークの実験結果は、AwareCompilerがパフォーマンスと効率の両方で既存のベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2025-10-13T02:02:36Z) - A Modular Algorithm for Non-Stationary Online Convex-Concave Optimization [10.66415966839617]
目標は、性能の重要な指標である動的双対性ギャップ(D-DGap)を最小限にすることである。
既存のアルゴリズムは、特に静止環境や予測可能な環境で、最適な性能を提供できない。
提案アルゴリズムは,最小限のD-DGap上限を対数係数まで達成し,誤差駆動型D-DGap境界を確実にする。
論文 参考訳(メタデータ) (2025-09-09T16:33:38Z) - Reflection-Enhanced Meta-Optimization Integrating TextGrad-style Prompt Optimization with Memory-Driven Self-Evolution [0.0]
本稿では,メモリ拡張リフレクションRetrievalRAGモジュールと自己適応型メタコントローラを統合するフレームワークを提案する。
REMOは、計算オーバーヘッドの増加にもかかわらず、より安定で堅牢なチューニングを実現する。
論文 参考訳(メタデータ) (2025-08-26T07:25:45Z) - Optimas: Optimizing Compound AI Systems with Globally Aligned Local Rewards [98.0983122471875]
複合システムの効率的な最適化のための統一的なフレームワークであるOptimasを提案する。
各イテレーションにおいて、Optimasはローカルリワード関数(LRF)を効率よく適用し、各コンポーネントのローカル報酬を最大化しながら、この特性を維持する。
我々は,5つの実世界の化合物システムに対して広範な評価を行い,オプティマスが11.92%の平均的な改善によって強いベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2025-07-03T07:12:48Z) - SOLVE: Synergy of Language-Vision and End-to-End Networks for Autonomous Driving [51.47621083057114]
SOLVEは、ビジョンランゲージモデルとエンド・ツー・エンド(E2E)モデルを相乗化して自動運転車の計画を強化する革新的なフレームワークである。
提案手法は,VLMとE2Eコンポーネント間の包括的インタラクションを実現するために,共有ビジュアルエンコーダによる機能レベルでの知識共有を重視している。
論文 参考訳(メタデータ) (2025-05-22T15:44:30Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - Transformer-based Model Predictive Control: Trajectory Optimization via Sequence Modeling [16.112708478263745]
本稿では,最適化に基づく学習手法の主な強みを組み合わせた統合フレームワークを提案する。
我々のアプローチでは、最適化プロセス内に高容量、トランスフォーマーベースのニューラルネットワークモデルを組み込む必要がある。
純粋に最適化に基づくアプローチと比較すると,提案手法では最大75%の性能向上が期待できる。
論文 参考訳(メタデータ) (2024-10-31T13:23:10Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Accelerated Federated Learning with Decoupled Adaptive Optimization [53.230515878096426]
フェデレートドラーニング(FL)フレームワークは、クライアント上のトレーニングデータのプライバシを維持しながら、共有モデルを協調的に学習することを可能にする。
近年,SGDM,Adam,AdaGradなどの集中型適応最適化手法をフェデレートした設定に一般化するためのイテレーションが多数実施されている。
本研究は、常微分方程式(ODE)のダイナミクスの観点から、FLの新しい適応最適化手法を開発することを目的としている。
論文 参考訳(メタデータ) (2022-07-14T22:46:43Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。