論文の概要: Uncertainty-Aware Measurement of Scenario Suite Representativeness for Autonomous Systems
- arxiv url: http://arxiv.org/abs/2511.14853v1
- Date: Tue, 18 Nov 2025 19:05:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.498031
- Title: Uncertainty-Aware Measurement of Scenario Suite Representativeness for Autonomous Systems
- Title(参考訳): 自律システムにおけるシナリオスイートの非確実性計測
- Authors: Robab Aghazadeh Chakherlou, Siddartha Khastgir, Xingyu Zhao, Jerein Jeyachandran, Shufeng Chen,
- Abstract要約: 本稿では,学習とテストに使用されるシナリオベースのデータが,システムが安全に動作するように設計された運用条件を反映する程度に,代表性に焦点を当てる。
シナリオスイートによって符号化された特徴の統計的分布と、ターゲット操作領域(TOD)を表す特徴の対応する分布とを比較して、代表性を定量化する確率的手法を提案する。
- 参考スコア(独自算出の注目度): 2.8984355830922692
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Assuring the trustworthiness and safety of AI systems, e.g., autonomous vehicles (AV), depends critically on the data-related safety properties, e.g., representativeness, completeness, etc., of the datasets used for their training and testing. Among these properties, this paper focuses on representativeness-the extent to which the scenario-based data used for training and testing, reflect the operational conditions that the system is designed to operate safely in, i.e., Operational Design Domain (ODD) or expected to encounter, i.e., Target Operational Domain (TOD). We propose a probabilistic method that quantifies representativeness by comparing the statistical distribution of features encoded by the scenario suites with the corresponding distribution of features representing the TOD, acknowledging that the true TOD distribution is unknown, as it can only be inferred from limited data. We apply an imprecise Bayesian method to handle limited data and uncertain priors. The imprecise Bayesian formulation produces interval-valued, uncertainty-aware estimates of representativeness, rather than a single value. We present a numerical example comparing the distributions of the scenario suite and the inferred TOD across operational categories-weather, road type, time of day, etc., under dependencies and prior uncertainty. We estimate representativeness locally (between categories) and globally as an interval.
- Abstract(参考訳): AIシステムの信頼性と安全性の確保、例えば自動運転車(AV)は、トレーニングやテストに使用されるデータセットのデータ関連の安全性特性、例えば、代表性、完全性などに依存する。
これらの特性の中で,本論文は,訓練とテストに使用されるシナリオベースのデータが,運用設計領域(ODD)の安全運用を意図した運用条件,すなわち,目標運用領域(TOD)に遭遇するであろう運用条件を反映している,という代表性に焦点をあてる。
シナリオスイートによって符号化された特徴の統計的分布とTODを表す特徴の対応する分布を比較して,その真のTOD分布が未知であることを認め,表現性を定量化する確率的手法を提案する。
限られたデータと不確実な事前を扱うために不正確なベイズ法を適用する。
不正確なベイズの公式化は、単一の値ではなく、間隔評価された不確実性を考慮した代表性の見積もりを生成する。
本稿では, シナリオスイートと推定TODの分布を, 依存や事前の不確実性の下で, 運用カテゴリ別, 道路タイプ別, 日時別等で比較した数値例を示す。
局所的な代表性(カテゴリ間)とグローバルなインターバルを推定する。
関連論文リスト
- SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Exact characterization of ε-Safe Decision Regions for exponential family distributions and Multi Cost SVM approximation [2.225810431340323]
対象(安全)クラスの予測が確率的に保証される入力空間のサブセットであるepsilon-Safe Decision Regionの形式的定義を導入する。
この制限に触発されて、安全領域を近似し、不均衡なデータを処理できるSVMベースのアルゴリズムであるMulti Cost SVMを開発した。
論文 参考訳(メタデータ) (2025-01-29T16:14:35Z) - Scope Compliance Uncertainty Estimate [0.4262974002462632]
SafeMLはそのような監視を行うためのモデルに依存しないアプローチである。
この研究は、二項決定を連続計量に変換することによってこれらの制限に対処する。
論文 参考訳(メタデータ) (2023-12-17T19:44:20Z) - Statistical Inference Under Constrained Selection Bias [20.862583584531322]
本稿では,選択バイアスが存在する場合の統計的推測を可能にする枠組みを提案する。
出力は、目標分布に対する推定値に対する高確率境界である。
我々はこれらの境界を推定するための手法の計算的および統計的特性を分析し、これらの手法が様々なシミュレートされた半合成的なタスクに対して情報的境界を生成可能であることを示す。
論文 参考訳(メタデータ) (2023-06-05T23:05:26Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Predicting with Confidence on Unseen Distributions [90.68414180153897]
ドメイン適応と予測不確実性文学を結びつけて、挑戦的な未知分布のモデル精度を予測する。
分類器の予測における信頼度(DoC)の差は,様々な変化に対して,分類器の性能変化を推定することに成功した。
具体的には, 合成分布と自然分布の区別について検討し, その単純さにもかかわらず, DoCは分布差の定量化に優れることを示した。
論文 参考訳(メタデータ) (2021-07-07T15:50:18Z) - Robust Validation: Confident Predictions Even When Distributions Shift [19.327409270934474]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。
本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。
私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文 参考訳(メタデータ) (2020-08-10T17:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。