論文の概要: Curiosity-Driven Testing for Sequential Decision-Making Process
- arxiv url: http://arxiv.org/abs/2509.02025v1
- Date: Tue, 02 Sep 2025 07:14:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.935956
- Title: Curiosity-Driven Testing for Sequential Decision-Making Process
- Title(参考訳): 逐次意思決定プロセスのための好奇性駆動テスト
- Authors: Junda He, Zhou Yang, Jieke Shi, Chengran Yang, Kisub Kim, Bowen Xu, Xin Zhou, David Lo,
- Abstract要約: シークエンシャル意思決定プロセス(SDP)は、自律運転、ロボット制御、交通管理といった複雑な現実の課題に基礎を置いている。
SDPは安全でない行動の学習に弱いままであり、安全クリティカルなアプリケーションに重大なリスクをもたらす。
SDMのための好奇心駆動型ブラックボックスファジテスト手法であるCureFuzzを提案する。
- 参考スコア(独自算出の注目度): 17.962527992405306
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sequential decision-making processes (SDPs) are fundamental for complex real-world challenges, such as autonomous driving, robotic control, and traffic management. While recent advances in Deep Learning (DL) have led to mature solutions for solving these complex problems, SDMs remain vulnerable to learning unsafe behaviors, posing significant risks in safety-critical applications. However, developing a testing framework for SDMs that can identify a diverse set of crash-triggering scenarios remains an open challenge. To address this, we propose CureFuzz, a novel curiosity-driven black-box fuzz testing approach for SDMs. CureFuzz proposes a curiosity mechanism that allows a fuzzer to effectively explore novel and diverse scenarios, leading to improved detection of crashtriggering scenarios. Additionally, we introduce a multi-objective seed selection technique to balance the exploration of novel scenarios and the generation of crash-triggering scenarios, thereby optimizing the fuzzing process. We evaluate CureFuzz on various SDMs and experimental results demonstrate that CureFuzz outperforms the state-of-the-art method by a substantial margin in the total number of faults and distinct types of crash-triggering scenarios. We also demonstrate that the crash-triggering scenarios found by CureFuzz can repair SDMs, highlighting CureFuzz as a valuable tool for testing SDMs and optimizing their performance.
- Abstract(参考訳): シークエンシャル意思決定プロセス(SDP)は、自律運転、ロボット制御、交通管理といった複雑な現実の課題に基礎を置いている。
近年のDeep Learning (DL) の進歩は、これらの複雑な問題を解決するための成熟したソリューションを生み出しているが、SDMは、安全クリティカルなアプリケーションにおいて重大なリスクを負う、安全でない振る舞いの学習に弱いままである。
しかしながら、さまざまなクラッシュトリガシナリオを識別できるSDMのテストフレームワークの開発は、依然としてオープンな課題である。
そこで本研究では,新しい好奇心駆動型ブラックボックスファジテスト手法であるCureFuzzを提案する。
CureFuzzは、ファジィザが新規で多様なシナリオを効果的に探索し、クラッシュトリガシナリオの検出を改善する好奇心のメカニズムを提案する。
さらに,新しいシナリオの探索とクラッシュトリガーシナリオの生成のバランスをとるために,多目的種選択手法を導入し,ファジリングプロセスを最適化する。
我々はCureFuzzを様々なSDM上で評価し、CureFuzzは故障数とクラッシュトリガシナリオの異なるタイプにおいて、最先端の手法よりもかなり優れた性能を示すことを示した。
我々はまた、CureFuzzが発見したクラッシュトリガシナリオがSDMを修復し、CureFuzzがSDMのテストとパフォーマンスの最適化に有用なツールであることを実証した。
関連論文リスト
- Fast and Robust: Task Sampling with Posterior and Diversity Synergies for Adaptive Decision-Makers in Randomized Environments [40.869524679544824]
Posterior and Diversity Synergized Task Smpling (PDTS) は、高速かつ堅牢なシーケンシャルな意思決定を実現するための、実装が容易な方法である。
PDTSは、堅牢なアクティブタスクサンプリングの可能性を解き、挑戦的なタスクにおけるゼロショットおよび少数ショット適応ロバスト性を大幅に改善し、特定のシナリオ下での学習プロセスを加速する。
論文 参考訳(メタデータ) (2025-04-27T07:27:17Z) - SimADFuzz: Simulation-Feedback Fuzz Testing for Autonomous Driving Systems [5.738863204900633]
SimADFuzzは、自律運転システムにおける違反を明らかにする高品質なシナリオを生成するように設計された、新しいフレームワークである。
SimADFuzzは、シナリオ選択を最適化するために、ADS違反の可能性を評価する違反予測モデルを採用している。
総合的な実験により、SimADFuzzは32以上のユニークな違反を識別することで最先端のファズーより優れていることが示された。
論文 参考訳(メタデータ) (2024-12-18T12:49:57Z) - Reshaping the Online Data Buffering and Organizing Mechanism for Continual Test-Time Adaptation [49.53202761595912]
継続的なテスト時間適応は、訓練済みのソースモデルを適用して、教師なしのターゲットドメインを継続的に変更する。
我々は、オンライン環境、教師なしの自然、エラー蓄積や破滅的な忘れのリスクなど、このタスクの課題を分析する。
教師なしシングルパスデータストリームから重要サンプルを高い確実性で識別・集約する不確実性を考慮したバッファリング手法を提案する。
論文 参考訳(メタデータ) (2024-07-12T15:48:40Z) - Diversity-guided Search Exploration for Self-driving Cars Test
Generation through Frenet Space Encoding [4.135985106933988]
自動運転車(SDC)の台頭は、動的環境に対処する上で重要な安全上の課題を提示している。
フィールドテストは不可欠であるが、現在の手法では重要なSDCシナリオを評価するための多様性が欠如している。
本研究では, ディープラーニングバニラ変圧器モデルを用いて, アウトオブバウンド状態に導く可能性を示す。
論文 参考訳(メタデータ) (2024-01-26T06:57:00Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Adaptive Failure Search Using Critical States from Domain Experts [9.93890332477992]
フェールサーチは、シミュレーションまたは実世界のテストにおいて、かなりの走行距離をロギングすることで行うことができる。
ASTはマルコフ決定プロセスとして失敗探索の問題を提起する手法である。
ASTフレームワークにクリティカルステートを組み込むことで,安全性違反の増大を伴う障害シナリオが生成されることを示す。
論文 参考訳(メタデータ) (2023-04-01T18:14:41Z) - MDPFuzz: Testing Models Solving Markov Decision Processes [10.53962813929928]
MDPFuzzはマルコフ決定過程(MDP)を解くための最初のブラックボックスファズテストフレームワークである。
MDPFuzzは、ターゲットモデルが異常状態と危険な状態に入るかどうかを確認することで、オークルをテストする。
衝突トリガー状態は正常に見えるが、正常状態と比較してニューロンの活性化パターンが異なることが示唆された。
論文 参考訳(メタデータ) (2021-12-06T06:35:55Z) - Generating and Characterizing Scenarios for Safety Testing of Autonomous
Vehicles [86.9067793493874]
最先端運転シミュレータを用いて,テストシナリオを特徴付け,生成するための効率的なメカニズムを提案する。
次世代シミュレーション(NGSIM)プロジェクトにおける実運転データの特徴付けに本手法を用いる。
事故回避の複雑さに基づいてメトリクスを定義してシナリオをランク付けし、事故発生の可能性を最小限に抑えるための洞察を提供します。
論文 参考訳(メタデータ) (2021-03-12T17:00:23Z) - Increasing the Confidence of Deep Neural Networks by Coverage Analysis [71.57324258813674]
本稿では、異なる安全でない入力に対してモデルを強化するために、カバレッジパラダイムに基づく軽量な監視アーキテクチャを提案する。
実験結果から,提案手法は強力な対向例とアウト・オブ・ディストリビューション・インプットの両方を検出するのに有効であることが示唆された。
論文 参考訳(メタデータ) (2021-01-28T16:38:26Z) - Multimodal Safety-Critical Scenarios Generation for Decision-Making
Algorithms Evaluation [23.43175124406634]
既存のニューラルネットワークベースの自律システムは、敵の攻撃に対して脆弱であることが示されている。
意思決定アルゴリズムの評価のためのフローベースマルチモーダル安全クリティカルシナリオジェネレータを提案する。
生成したトラフィックシナリオを用いて6つの強化学習アルゴリズムを評価し,その堅牢性に関する実証的な結論を提供する。
論文 参考訳(メタデータ) (2020-09-16T15:16:43Z) - Soft Hindsight Experience Replay [77.99182201815763]
ソフト・ハイドサイト・エクスペリエンス・リプレイ(SHER)は,HERと最大エントロピー強化学習(MERL)に基づく新しいアプローチである
オープンAIロボット操作タスクにおけるSHERの評価を行った。
論文 参考訳(メタデータ) (2020-02-06T03:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。