論文の概要: Evaluation of adaptive sampling methods in scenario generation for virtual safety impact assessment of pre-crash safety systems
- arxiv url: http://arxiv.org/abs/2503.00815v1
- Date: Sun, 02 Mar 2025 09:44:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:13:18.467410
- Title: Evaluation of adaptive sampling methods in scenario generation for virtual safety impact assessment of pre-crash safety systems
- Title(参考訳): プレクラッシュ安全システムの仮想安全影響評価のためのシナリオ生成における適応サンプリング手法の評価
- Authors: Xiaomi Yang, Henrik Imberg, Carol Flannagan, Jonas Bärgman,
- Abstract要約: シミュレーションベースのシナリオ生成におけるパラメータの数が増加するにつれて、シミュレートするクラッシュシナリオの数が指数関数的に増加する。
この課題に対処するために、重要サンプリングやアクティブサンプリングなどの効率的なサンプリング手法が提案されている。
本研究は,2つのドメイン知識駆動型特徴を取り入れたシナリオ生成における重要サンプリングとアクティブサンプリングの性能を評価する。
- 参考スコア(独自算出の注目度): 1.0687104237121408
- License:
- Abstract: Virtual safety assessment plays a vital role in evaluating the safety impact of pre-crash safety systems such as advanced driver assistance systems (ADAS) and automated driving systems (ADS). However, as the number of parameters in simulation-based scenario generation increases, the number of crash scenarios to simulate grows exponentially, making complete enumeration computationally infeasible. Efficient sampling methods, such as importance sampling and active sampling, have been proposed to address this challenge. However, a comprehensive evaluation of how domain knowledge, stratification, and batch sampling affect their efficiency remains limited. This study evaluates the performance of importance sampling and active sampling in scenario generation, incorporating two domain-knowledge-driven features: adaptive sample space reduction (ASSR) and stratification. Additionally, we assess the effects of a third feature, batch sampling, on computational efficiency in terms of both CPU and wall-clock time. Based on our findings, we provide practical recommendations for applying ASSR, stratification, and batch sampling to optimize sampling performance. Our results demonstrate that ASSR substantially improves sampling efficiency for both importance sampling and active sampling. When integrated into active sampling, ASSR reduces the root mean squared estimation error (RMSE) of the estimates by up to 90\%. Stratification further improves sampling performance for both methods, regardless of ASSR implementation. When ASSR and/or stratification are applied, importance sampling performs on par with active sampling, whereas when neither feature is used, active sampling is more efficient. Larger batch sizes reduce wall-clock time but increase the number of simulations required to achieve the same estimation accuracy.
- Abstract(参考訳): 仮想安全評価は、高度運転支援システム (ADAS) や自動運転システム (ADS) など、クレーシュ前安全システムの安全性への影響を評価する上で重要な役割を担っている。
しかし、シミュレーションベースのシナリオ生成におけるパラメータの数が増加するにつれて、シミュレートするクラッシュシナリオの数が指数関数的に増加し、完全な列挙計算が不可能になる。
この課題に対処するために、重要サンプリングやアクティブサンプリングなどの効率的なサンプリング手法が提案されている。
しかし、ドメイン知識、成層化、バッチサンプリングが効率に与える影響を総合的に評価することは依然として限られている。
本研究では, シナリオ生成における重要サンプリングとアクティブサンプリングの性能を評価し, 適応型サンプル空間縮小(ASSR)と成層化の2つのドメイン知識駆動型特徴を取り入れた。
さらに,第3の特徴であるバッチサンプリングがCPUと壁面時間の両方で計算効率に与える影響を評価する。
そこで本研究では,ASSR,成層化,バッチサンプリングを適用し,サンプリング性能を最適化する実用的な提案を行った。
以上の結果から,ASSRはサンプリング効率を大幅に改善し,重要サンプリングとアクティブサンプリングの両立を図った。
アクティブサンプリングに統合されると、ASSRは推定値のルート平均2乗推定誤差(RMSE)を最大90%削減する。
ストラテフィケーションは、ASSRの実装にかかわらず、両方の手法のサンプリング性能をさらに改善する。
ASSRおよび/または成層化を適用すると、重要サンプリングはアクティブサンプリングと同等に実行されるが、どちらの特徴も使用しない場合にはアクティブサンプリングの方が効率的である。
より大きなバッチサイズは、ウォールタイム時間を短縮するが、同じ推定精度を達成するのに必要なシミュレーションの数を増やす。
関連論文リスト
- Risk-Averse Certification of Bayesian Neural Networks [70.44969603471903]
本稿では,RAC-BNNと呼ばれるベイズニューラルネットワークに対するリスク・アバース認証フレームワークを提案する。
提案手法はサンプリングと最適化を利用して,BNNの出力集合の音響近似を計算する。
我々は,RAC-BNNを回帰および分類ベンチマークで検証し,その性能を最先端の手法と比較した。
論文 参考訳(メタデータ) (2024-11-29T14:22:51Z) - Policy Gradient with Active Importance Sampling [55.112959067035916]
政策勾配法(PG法)はISの利点を大いに生かし、以前に収集したサンプルを効果的に再利用することができる。
しかし、ISは歴史的サンプルを再重み付けするための受動的ツールとしてRLに採用されている。
我々は、政策勾配のばらつきを減らすために、サンプルを収集する最良の行動ポリシーを模索する。
論文 参考訳(メタデータ) (2024-05-09T09:08:09Z) - Adaptive Testing Environment Generation for Connected and Automated
Vehicles with Dense Reinforcement Learning [7.6589102528398065]
複数のサロゲートモデルを組み込んだアダプティブテスト環境を構築する。
そこで本研究では,高効率な高密度強化学習手法を提案し,新しい適応政策を考案する。
論文 参考訳(メタデータ) (2024-02-29T15:42:33Z) - Posterior Sampling with Delayed Feedback for Reinforcement Learning with
Linear Function Approximation [62.969796245827006]
Delayed-PSVI は楽観的な値に基づくアルゴリズムであり、後続サンプリングによる雑音摂動により値関数空間を探索する。
我々のアルゴリズムは、未知の遅延が存在する場合に、$widetildeO(sqrtd3H3 T + d2H2 E[tau]$最悪の後悔を実現する。
遅延LPSVIのための勾配に基づく近似サンプリングスキームをLangevin動的に組み込んだ。
論文 参考訳(メタデータ) (2023-10-29T06:12:43Z) - MEET: A Monte Carlo Exploration-Exploitation Trade-off for Buffer
Sampling [2.501153467354696]
経験リプレイバッファのための最先端サンプリング戦略は強化学習エージェントの性能を向上させる。
Q値推定に不確実性は含まない。
本稿では,探索・探索トレードオフを利用した新しいサンプリング戦略を提案する。
論文 参考訳(メタデータ) (2022-10-24T18:55:41Z) - Sampling Through the Lens of Sequential Decision Making [9.101505546901999]
我々はアダプティブ・サンプル・ウィズ・リワード(ASR)と呼ばれる報酬誘導型サンプリング戦略を提案する。
提案手法は,サンプリング過程を最適に調整し,最適性能を実現する。
情報検索とクラスタリングの実証的な結果は、異なるデータセット間でのASRのスーパーブパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-08-17T04:01:29Z) - Generating Negative Samples for Sequential Recommendation [83.60655196391855]
逐次レコメンデーション(SR)のための負のサンプル(イテム)を生成することを提案する。
アイテムに対する現在のSRモデルの学習されたユーザの好みに基づいて、各タイムステップで負の項目をサンプリングする。
4つの公開データセットの実験は、SRに高品質な負のサンプルを提供することの重要性を検証する。
論文 参考訳(メタデータ) (2022-08-07T05:44:13Z) - Sample Efficient Deep Reinforcement Learning via Uncertainty Estimation [12.415463205960156]
モデルフリー深部強化学習(RL)アルゴリズムでは、ノイズ値推定を用いて政策評価と最適化を監督し、サンプル効率を損なう。
RLで発生するノイズ管理における不確実性の原因を系統的に分析する。
本稿では,2つの相補的不確実性推定手法がQ値と環境の両方を考慮し,ノイズ管理の負の影響を緩和する手法を提案する。
論文 参考訳(メタデータ) (2022-01-05T15:46:06Z) - Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.47536050785886]
我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。
グループサンプリングを提案し、同じクラスのサンプルをグループに集める。
Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文 参考訳(メタデータ) (2021-07-07T05:39:58Z) - Efficient Black-Box Importance Sampling for VaR and CVaR Estimation [0.0]
本稿では,機械学習機能マップなどの高度なオブジェクトから定義された損失のテールリスクを推定するためのImportance Smpling(IS)について考察する。
本稿では,リスクにおける価値とリスクにおける条件的価値を推定するための効率的なISを提案する。
論文 参考訳(メタデータ) (2021-06-16T01:29:11Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。