論文の概要: The Adaptive Stress Testing Formulation
- arxiv url: http://arxiv.org/abs/2004.04293v1
- Date: Wed, 8 Apr 2020 23:04:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 08:46:12.992150
- Title: The Adaptive Stress Testing Formulation
- Title(参考訳): アダプティブストレステストの定式化
- Authors: Mark Koren, Anthony Corso, and Mykel J. Kochenderfer
- Abstract要約: シミュレーションはしばしば、堅牢なバリデーションを提供するには単純すぎるか、難解に計算するには複雑すぎるかのどちらかである。
本稿では、適応ストレステスト(AST)というブラックボックスアプローチの背景にある理論について述べる。
- 参考スコア(独自算出の注目度): 33.470486257476544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Validation is a key challenge in the search for safe autonomy. Simulations
are often either too simple to provide robust validation, or too complex to
tractably compute. Therefore, approximate validation methods are needed to
tractably find failures without unsafe simplifications. This paper presents the
theory behind one such black-box approach: adaptive stress testing (AST). We
also provide three examples of validation problems formulated to work with AST.
- Abstract(参考訳): 検証は安全な自律性を求める上で重要な課題である。
シミュレーションはしばしば、堅牢なバリデーションを提供するには単純すぎるか、難解に計算するには複雑すぎる。
そのため,安全性を損なうことなく障害を気軽に発見するためには,近似的な検証手法が必要となる。
本稿では、適応ストレステスト(AST)というブラックボックス手法の背景にある理論について述べる。
また、ASTを扱うために定式化されたバリデーション問題の3つの例を示す。
関連論文リスト
- Distribution Learning with Valid Outputs Beyond the Worst-Case [25.788559173418363]
妥当性に制約のある分布学習は、学習された分布が、空間の無効な部分において、その質量の確率的に小さな部分を持つことを要求することによって、この問題に対処しようとする。
データ分散がモデルクラスに置かれ、ログロスが最小化されると、妥当性を保証するために必要なサンプルの数は、妥当性要求に弱いことが示される。
論文 参考訳(メタデータ) (2024-10-21T17:56:09Z) - Scalable Similarity-Aware Test Suite Minimization with Reinforcement Learning [6.9290255098776425]
TripRLは多種多様なテストスイートを生成し、高いテスト効率を実現している。
本稿では,TripRLのランタイムは,Multi-Criteria Test Suite Minimization問題の規模と線形にスケール可能であることを示す。
論文 参考訳(メタデータ) (2024-08-24T08:43:03Z) - Automatically Adaptive Conformal Risk Control [49.95190019041905]
本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文 参考訳(メタデータ) (2024-06-25T08:29:32Z) - Active Test-Time Adaptation: Theoretical Analyses and An Algorithm [51.84691955495693]
テスト時間適応(TTA)は、教師なし設定でストリーミングテストデータの分散シフトに対処する。
完全TTA設定内に能動学習を統合する能動テスト時間適応(ATTA)の新たな問題設定を提案する。
論文 参考訳(メタデータ) (2024-04-07T22:31:34Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。
テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。
合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文 参考訳(メタデータ) (2023-10-30T09:46:19Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - Cross-validation Confidence Intervals for Test Error [83.67415139421448]
この研究は、クロスバリデーションのための中心極限定理と、学習アルゴリズムの弱い安定性条件下での分散の一貫した推定器を開発する。
結果は、一般的な1対1のクロスバリデーションの選択にとって、初めてのものだ。
論文 参考訳(メタデータ) (2020-07-24T17:40:06Z) - Efficient statistical validation with edge cases to evaluate Highly
Automated Vehicles [6.198523595657983]
自動運転車の大規模展開は、まだ解決されていない多くの安全上の課題にもかかわらず、差し迫っているようだ。
既存の標準は、検証が要求をカバーするテストケースのセットだけを必要とする決定論的プロセスに焦点を当てています。
本稿では, 自動生成テストケースを最悪のシナリオに偏り付け, システムの挙動の統計的特性を計算するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-04T04:35:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。