論文の概要: Advancing Autonomous Driving System Testing: Demands, Challenges, and Future Directions
- arxiv url: http://arxiv.org/abs/2512.11887v1
- Date: Tue, 09 Dec 2025 06:33:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:55.996415
- Title: Advancing Autonomous Driving System Testing: Demands, Challenges, and Future Directions
- Title(参考訳): 自律運転システムテストの推進:需要、課題、今後の方向性
- Authors: Yihan Liao, Jingyu Zhang, Jacky Keung, Yan Xiao, Yurou Dai,
- Abstract要約: 自律運転システム(ADS)は、輸送効率と安全性の向上を約束するが、複雑な現実世界環境における信頼性を確保することは重要な課題である。
本研究では,モジュールシステムとエンドツーエンドシステムの両方において,現在のADSテストの実践について検討する。
主要なテスト手法を概観し,V2X通信や基礎モデルなどの新たな要素について考察する。
- 参考スコア(独自算出の注目度): 16.701909787572724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous driving systems (ADSs) promise improved transportation efficiency and safety, yet ensuring their reliability in complex real-world environments remains a critical challenge. Effective testing is essential to validate ADS performance and reduce deployment risks. This study investigates current ADS testing practices for both modular and end-to-end systems, identifies key demands from industry practitioners and academic researchers, and analyzes the gaps between existing research and real-world requirements. We review major testing techniques and further consider emerging factors such as Vehicle-to-Everything (V2X) communication and foundation models, including large language models and vision foundation models, to understand their roles in enhancing ADS testing. We conducted a large-scale survey with 100 participants from both industry and academia. Survey questions were refined through expert discussions, followed by quantitative and qualitative analyses to reveal key trends, challenges, and unmet needs. Our results show that existing ADS testing techniques struggle to comprehensively evaluate real-world performance, particularly regarding corner case diversity, the simulation to reality gap, the lack of systematic testing criteria, exposure to potential attacks, practical challenges in V2X deployment, and the high computational cost of foundation model-based testing. By further analyzing participant responses together with 105 representative studies, we summarize the current research landscape and highlight major limitations. This study consolidates critical research gaps in ADS testing and outlines key future research directions, including comprehensive testing criteria, cross-model collaboration in V2X systems, cross-modality adaptation for foundation model-based testing, and scalable validation frameworks for large-scale ADS evaluation.
- Abstract(参考訳): 自律運転システム(ADS)は、輸送効率と安全性の向上を約束するが、複雑な現実世界環境における信頼性を確保することは重要な課題である。
効果的なテストは、ADSのパフォーマンスを検証し、デプロイメントのリスクを減らすために不可欠である。
本研究は,モジュールシステムとエンド・ツー・エンドシステムの両方における現在のADSテストの実践について検討し,産業従事者と学術研究者の重要な要求を特定し,既存研究と実世界の要件のギャップを分析する。
本稿では,大規模な言語モデルや視覚基盤モデルを含む,V2Xコミュニケーションや基礎モデルなどの新たな要素について検討し,ADSテストの強化におけるそれらの役割について考察する。
産学・産学ともに100名を対象に大規模調査を行った。
調査質問は専門家の議論を通じて洗練され、続いて定量的で質的な分析によって重要なトレンド、課題、未解決のニーズを明らかにした。
以上の結果から,既存のADSテスト技術は,特にコーナーケースの多様性,現実のギャップへのシミュレーション,体系的なテスト基準の欠如,潜在的な攻撃への曝露,V2Xデプロイメントにおける実践的課題,基礎モデルベーステストの計算コストの増大など,実世界のパフォーマンスを総合的に評価する上で困難であることが示唆された。
105の代表的な研究とともに参加者の反応をさらに分析することにより、現在の研究状況を要約し、大きな限界を浮き彫りにする。
本研究は, ADSテストにおける重要な研究ギャップを整理し, 総合的なテスト基準, V2Xシステムにおけるクロスモデルコラボレーション, 基礎モデルベーステストのためのクロスモダリティ適応, 大規模ADS評価のためのスケーラブルな検証フレームワークなど, 今後の研究方向性を概説する。
関連論文リスト
- ATLAS: A High-Difficulty, Multidisciplinary Benchmark for Frontier Scientific Reasoning [118.46980291324148]
ATLASは、約800のオリジナルの問題からなる大規模で、高精度で、学際横断的な評価スイートである。
主な特徴は次のとおりである。 テストデータの漏洩を防ぐために新しく作成されたり、実質的に適応されたすべての質問を含む、高いオリジン性と汚染抵抗。
先行モデルに関する予備的な結果は、ATLASが先進的な科学的推論能力の差別化に有効であることを証明している。
論文 参考訳(メタデータ) (2025-11-18T11:13:06Z) - Demystifying deep search: a holistic evaluation with hint-free multi-hop questions and factorised metrics [89.1999907891494]
We present WebDetective, a benchmark of hint-free multi-hop questions with a control Wikipedia sandbox。
25の最先端モデルに対する我々の評価は、すべてのアーキテクチャにまたがる体系的な弱点を明らかにしている。
私たちはエージェントワークフローであるEvidenceLoopを開発し、ベンチマークが特定する課題を明示的にターゲットしています。
論文 参考訳(メタデータ) (2025-10-01T07:59:03Z) - Generative AI for Testing of Autonomous Driving Systems: A Survey [13.226510198306885]
自律運転システム(ADS)は、社会に多大な利益をもたらす可能性がある研究の活発な領域である。
異なるテストアプローチが必要であり、ADSの効率的かつ効率的なテストを実現することは、依然としてオープンな課題である。
生成AIは多くのドメインにまたがる強力なツールとして登場し、コンテキストを解釈する能力により、ADSテストにも適用されつつある。
この調査は、ADSのテストにおける生成AIの使用に関する概要と実践的な洞察を提供し、既存の課題を強調し、この急速に発展する分野における将来の研究の方向性を概説する。
論文 参考訳(メタデータ) (2025-08-27T13:40:14Z) - AI-Driven Tools in Modern Software Quality Assurance: An Assessment of Benefits, Challenges, and Future Directions [0.0]
この研究は、現代のAI指向ツールを品質保証プロセスに統合するメリット、課題、および展望を評価することを目的としている。
この研究は、AIがQAに変革をもたらす可能性を実証しているが、これらの技術を実装するための戦略的アプローチの重要性を強調している。
論文 参考訳(メタデータ) (2025-06-19T20:22:47Z) - Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - A Survey on the Application of Large Language Models in Scenario-Based Testing of Automated Driving Systems [6.608557716494977]
論文は5つのオープンな課題と潜在的研究の方向性を概説することで締めくくっている。
LLM(Large Language Models)の出現は、シナリオベースのテストを強化する新たな機会をもたらした。
論文 参考訳(メタデータ) (2025-05-22T12:25:44Z) - SoK: On Closing the Applicability Gap in Automated Vulnerability Detection [0.18846515534317265]
自動脆弱性検出(AVD)は、脆弱性を特定するためにソースコードを自律的に解析することを目的としている。
現在のAVD研究はコアコンポーネントにまたがってどのように分散されているのか、将来の研究対象はソフトウェア開発全体を通してのAVDの実践的適用性のギャップを埋めるための重要な領域であるべきなのか、という2つの主要な研究課題に対処する。
タスクの定式化と粒度,入力プログラム言語と表現,検出アプローチとキーソリューション,評価指標とデータセット,報告パフォーマンスの5つのコアコンポーネントを対象に,79以上のAVD記事と17の実証的研究を体系化する。
論文 参考訳(メタデータ) (2024-12-15T14:01:41Z) - Failure Diagnosis in Microservice Systems: A Comprehensive Survey and Analysis [10.92325792850306]
この調査は2003年から現在までの98の科学論文の総括的なレビューを提供する。
これには、基本的な概念、システムアーキテクチャ、問題ステートメントの徹底的な検証と解明が含まれる。
ディメンションの質的な分析も含み、現在のベストプラクティスと今後の方向性に関する詳細な議論を提供する。
論文 参考訳(メタデータ) (2024-06-27T10:25:37Z) - Testing autonomous vehicles and AI: perspectives and challenges from cybersecurity, transparency, robustness and fairness [53.91018508439669]
この研究は、人工知能を自律走行車(AV)に統合する複雑さを探求する
AIコンポーネントがもたらした課題と、テスト手順への影響を調べます。
本稿は、重要な課題を特定し、AV技術におけるAIの研究・開発に向けた今後の方向性を提案する。
論文 参考訳(メタデータ) (2024-02-21T08:29:42Z) - Quality meets Diversity: A Model-Agnostic Framework for Computerized
Adaptive Testing [60.38182654847399]
コンピュータ適応テスト(CAT)は多くのシナリオで有望なテストアプリケーションとして現れています。
CAT ソリューションのための新しいフレームワークである Model-Agnostic Adaptive Testing (MAAT) を提案する。
論文 参考訳(メタデータ) (2021-01-15T06:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。