論文の概要: DiCriTest: Testing Scenario Generation for Decision-Making Agents Considering Diversity and Criticality
- arxiv url: http://arxiv.org/abs/2508.11514v1
- Date: Fri, 15 Aug 2025 14:51:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:24.053009
- Title: DiCriTest: Testing Scenario Generation for Decision-Making Agents Considering Diversity and Criticality
- Title(参考訳): DiCriTest: 多様性と臨界性を考慮した意思決定エージェントのテストシナリオ生成
- Authors: Qitong Chu, Yufeng Yue, Danya Yao, Huaxin Pei,
- Abstract要約: 多様性と臨界性を考慮したテストシナリオを生成するための二重空間案内型テストフレームワークを提案する。
シナリオパラメータ空間において、階層的表現フレームワークは次元の減少と多次元部分空間評価を組み合わせたものである。
実験により、我々のフレームワークは、平均56.23%の臨界シナリオ生成を改善し、新しいパラメータ-振る舞い共駆動メトリクスの下でより多様性を示す。
- 参考スコア(独自算出の注目度): 7.423385812827565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing deployment of decision-making agents in dynamic environments increases the demand for safety verification. While critical testing scenario generation has emerged as an appealing verification methodology, effectively balancing diversity and criticality remains a key challenge for existing methods, particularly due to local optima entrapment in high-dimensional scenario spaces. To address this limitation, we propose a dual-space guided testing framework that coordinates scenario parameter space and agent behavior space, aiming to generate testing scenarios considering diversity and criticality. Specifically, in the scenario parameter space, a hierarchical representation framework combines dimensionality reduction and multi-dimensional subspace evaluation to efficiently localize diverse and critical subspaces. This guides dynamic coordination between two generation modes: local perturbation and global exploration, optimizing critical scenario quantity and diversity. Complementarily, in the agent behavior space, agent-environment interaction data are leveraged to quantify behavioral criticality/diversity and adaptively support generation mode switching, forming a closed feedback loop that continuously enhances scenario characterization and exploration within the parameter space. Experiments show our framework improves critical scenario generation by an average of 56.23\% and demonstrates greater diversity under novel parameter-behavior co-driven metrics when tested on five decision-making agents, outperforming state-of-the-art baselines.
- Abstract(参考訳): 動的環境における意思決定エージェントの展開の増加は、安全性検証の需要を増加させる。
重要なテストシナリオの生成は魅力的な検証手法として現れてきたが、特に高次元シナリオ空間における局所的最適包摂のために、多様性と臨界性の効果的なバランスは、既存の手法にとって重要な課題である。
この制限に対処するために、シナリオパラメータ空間とエージェントの振る舞い空間を協調するデュアルスペースガイドテストフレームワークを提案し、多様性と臨界性を考慮したテストシナリオを生成する。
具体的には、シナリオパラメータ空間において、階層的表現フレームワークは次元減少と多次元部分空間評価を組み合わせて、多次元および臨界部分空間を効率的に局所化する。
これは局所摂動と大域探査の2つの世代間の動的調整を導くもので、重要なシナリオの量と多様性を最適化する。
エージェント行動空間において、エージェント環境相互作用データを利用して行動臨界/多様性を定量化し、生成モード切替を適応的にサポートし、パラメータ空間内のシナリオのキャラクタリゼーションと探索を継続的に強化するクローズドフィードバックループを形成する。
実験の結果,5つの意思決定エージェントでテストすると,平均56.23\%の臨界シナリオ生成が向上し,パラメータ-行動共駆動の指標の下でより多様性が向上し,最先端のベースラインを上回っていることがわかった。
関連論文リスト
- Adaptability in Multi-Agent Reinforcement Learning: A Framework and Unified Review [9.246912481179464]
MARL(Multi-Agent Reinforcement Learning)は、シミュレーションベンチマークと制約付きシナリオ間で複数のエージェントを協調する上で、明らかな効果を示している。
この調査は、動的で実世界のマルチエージェントシステムへのデプロイに適したアルゴリズムの開発に寄与する。
論文 参考訳(メタデータ) (2025-07-14T10:39:17Z) - Continual Adaptation: Environment-Conditional Parameter Generation for Object Detection in Dynamic Scenarios [54.58186816693791]
環境は時間と空間によって常に変化し、クローズドセットの仮定に基づいて訓練された物体検出器にとって重要な課題となる。
そこで本研究では,微調整過程をパラメータ生成に変換する機構を提案する。
特に,2経路LoRAベースのドメイン認識アダプタを最初に設計し,特徴をドメイン不変およびドメイン固有コンポーネントに分解する。
論文 参考訳(メタデータ) (2025-06-30T17:14:12Z) - AgentAlign: Misalignment-Adapted Multi-Agent Perception for Resilient Inter-Agent Sensor Correlations [8.916036880001734]
既存の研究は、マルチエージェント設定における脆弱なマルチセンサ相関を概観している。
AgentAlignは、現実世界の異種エージェントのクロスモダリティ機能アライメントフレームワークである。
多様な環境条件下での現実的なセンサの欠陥をシミュレートする新しいV2XSet-noiseデータセットを提案する。
論文 参考訳(メタデータ) (2024-12-09T01:51:18Z) - Certifiably Robust Policies for Uncertain Parametric Environments [57.2416302384766]
本稿ではパラメータ上の未知分布を持つパラメトリックマルコフ決定プロセス(MDP)に基づくフレームワークを提案する。
パラメータによって誘導される未知のサンプル環境に対するIMDPの学習と解析を行う。
当社のアプローチは,信頼度の高い政策のパフォーマンスに厳密な拘束力をもたらすことを示す。
論文 参考訳(メタデータ) (2024-08-06T10:48:15Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Safety-Critical Scenario Generation Via Reinforcement Learning Based
Editing [20.99962858782196]
本稿では,逐次編集による安全クリティカルなシナリオを生成する深層強化学習手法を提案する。
我々のフレームワークは、リスクと妥当性の両方の目的からなる報酬関数を用いています。
提案手法は, 従来手法と比較して, 品質の高い安全クリティカルなシナリオを生成することを示す。
論文 参考訳(メタデータ) (2023-06-25T05:15:25Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。