論文の概要: Stability Under Scrutiny: Benchmarking Representation Paradigms for Online HD Mapping
- arxiv url: http://arxiv.org/abs/2510.10660v1
- Date: Sun, 12 Oct 2025 15:33:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.053399
- Title: Stability Under Scrutiny: Benchmarking Representation Paradigms for Online HD Mapping
- Title(参考訳): 精査下での安定性:オンラインHDマッピングのためのベンチマーク表現パラダイム
- Authors: Hao Shan, Ruikai Li, Han Jiang, Yizhe Fan, Ziyang Yan, Bohan Li, Xiaoshuai Hao, Hao Zhao, Zhiyong Cui, Yilong Ren, Haiyang Yu,
- Abstract要約: 本稿では,オンラインHDマッピングモデルの時間的安定性を評価するための,最初の総合的ベンチマークを提案する。
そこで本研究では,Presence,Localization,Shape stabilityの新たな指標を用いた多次元安定性評価フレームワークを提案する。
本研究は、より信頼性の高い自律運転システムの開発を進めるとともに、時間的安定性をコア評価基準として扱うことの重要性を強調した。
- 参考スコア(独自算出の注目度): 25.516502412129096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As one of the fundamental modules in autonomous driving, online high-definition (HD) maps have attracted significant attention due to their cost-effectiveness and real-time capabilities. Since vehicles always cruise in highly dynamic environments, spatial displacement of onboard sensors inevitably causes shifts in real-time HD mapping results, and such instability poses fundamental challenges for downstream tasks. However, existing online map construction models tend to prioritize improving each frame's mapping accuracy, while the mapping stability has not yet been systematically studied. To fill this gap, this paper presents the first comprehensive benchmark for evaluating the temporal stability of online HD mapping models. We propose a multi-dimensional stability evaluation framework with novel metrics for Presence, Localization, and Shape Stability, integrated into a unified mean Average Stability (mAS) score. Extensive experiments on 42 models and variants show that accuracy (mAP) and stability (mAS) represent largely independent performance dimensions. We further analyze the impact of key model design choices on both criteria, identifying architectural and training factors that contribute to high accuracy, high stability, or both. To encourage broader focus on stability, we will release a public benchmark. Our work highlights the importance of treating temporal stability as a core evaluation criterion alongside accuracy, advancing the development of more reliable autonomous driving systems. The benchmark toolkit, code, and models will be available at https://stablehdmap.github.io/.
- Abstract(参考訳): 自動運転の基本的なモジュールの1つとして、オンラインハイデフィニション(HD)マップは、コスト効率とリアルタイム機能のために大きな注目を集めている。
車両は常に非常にダイナミックな環境で走行するため、車載センサーの空間変位は必然的にリアルタイムHDマッピング結果の変化を引き起こし、そのような不安定性は下流タスクに根本的な課題をもたらす。
しかし、既存のオンラインマップ構築モデルは、各フレームのマッピング精度の向上を優先する傾向にあるが、マッピング安定性はまだ体系的に研究されていない。
このギャップを埋めるために,オンラインHDマッピングモデルの時間的安定性を評価するための,最初の総合的なベンチマークを提案する。
本研究では, 平均安定度(mAS)スコアに統一された, 精度, 局所化, 形状安定性の新たな指標を用いた多次元安定性評価フレームワークを提案する。
42のモデルと変種に対する大規模な実験は、精度(mAP)と安定性(mAS)がほぼ独立した性能の次元を表すことを示している。
さらに、重要なモデル設計選択が両方の基準に与える影響を分析し、高い正確性、高い安定性、あるいは両方に寄与するアーキテクチャおよびトレーニング要因を特定します。
安定性にもっと焦点を合わせるために、私たちはパブリックベンチマークをリリースします。
本研究は、より信頼性の高い自律運転システムの開発を進めるとともに、時間的安定性をコア評価基準として扱うことの重要性を強調した。
ベンチマークツールキット、コード、モデルはhttps://stablehdmap.github.io/.com/で公開される。
関連論文リスト
- ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Prompt Stability in Code LLMs: Measuring Sensitivity across Emotion- and Personality-Driven Variations [40.12950482269347]
本稿では,感情テンプレートと人格テンプレートを用いた意味論的に等価なプロンプト変種を生成するフレームワークであるPromptSEを提案する。
本研究は、性能と安定性が、主に分離された最適化目標として振る舞うことを示す。
PromptSEは、デプロイとモデル選択のためのパフォーマンス安定性トレードオフの定量化を可能にする。
論文 参考訳(メタデータ) (2025-09-17T04:17:42Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Prompt Stability Matters: Evaluating and Optimizing Auto-Generated Prompt in General-Purpose Systems [19.59294293070619]
モデル応答の応答一貫性を評価するための基準としてセマンティック安定性を導入する。
安定性に配慮した汎用的なプロンプト生成システムを開発した。
私たちの研究は、より信頼性の高い汎用システムを構築するための実践的なツールとして、迅速な設計に関する新たな視点を提供しています。
論文 参考訳(メタデータ) (2025-05-19T03:28:33Z) - Towards Robust Stability Prediction in Smart Grids: GAN-based Approach under Data Constraints and Adversarial Challenges [53.2306792009435]
本稿では,安定したデータのみを用いて,スマートグリッドの不安定性を検出する新しいフレームワークを提案する。
最大98.1%の精度でグリッド安定性を予測でき、98.9%で敵の攻撃を検知できる。
シングルボードコンピュータ上で実装され、7ms以下の平均応答時間でリアルタイムな意思決定を可能にする。
論文 参考訳(メタデータ) (2025-01-27T20:48:25Z) - Large Continual Instruction Assistant [59.585544987096974]
CIT(Continuous Instruction Tuning)は、大規模モデルにデータによる人間の意図データに従うよう指示するために用いられる。
既存の更新勾配は、CITプロセス中に前のデータセットのパフォーマンスを著しく損なうことになる。
本稿では,この課題に対処する汎用的な連続的命令チューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-08T11:24:59Z) - DRIVE: Dependable Robust Interpretable Visionary Ensemble Framework in Autonomous Driving [1.4104119587524289]
自動運転の最近の進歩は、エンド・ツー・エンドの学習パラダイムへのパラダイムシフトを経験している。
これらのモデルは、しばしば解釈可能性を犠牲にし、信頼、安全、規制の遵守に重大な課題を提起する。
我々は、エンドツーエンドの教師なし運転モデルにおける説明の信頼性と安定性を改善するために設計された総合的なフレームワークDRIVEを紹介する。
論文 参考訳(メタデータ) (2024-09-16T14:40:47Z) - Towards Stable 3D Object Detection [64.49059005467817]
安定度指数(SI)は3次元検出器の安定性を信頼度、ボックスの定位、範囲、方向で総合的に評価できる新しい指標である。
モデルの安定性向上を支援するため,予測一貫性学習(PCL)と呼ばれる,汎用的で効果的なトレーニング戦略を導入する。
PCLは本質的に、異なるタイムスタンプと拡張の下で同じオブジェクトの予測一貫性を促進し、検出安定性を向上させる。
論文 参考訳(メタデータ) (2024-07-05T07:17:58Z) - Model Stability with Continuous Data Updates [2.439909645714735]
機械学習(ML)モデルの「安定性」を,大規模で複雑なNLPシステムのコンテキスト内で研究する。
ネットワークアーキテクチャや入力表現を含むモデル設計の選択は、安定性に重大な影響を与える。
モデリングの選択を行う際に、MLモデルデザイナが正確さとジッタのトレードオフを考慮に入れることを推奨する。
論文 参考訳(メタデータ) (2022-01-14T22:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。