論文の概要: AutoMT: A Multi-Agent LLM Framework for Automated Metamorphic Testing of Autonomous Driving Systems
- arxiv url: http://arxiv.org/abs/2510.19438v1
- Date: Wed, 22 Oct 2025 10:11:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.618678
- Title: AutoMT: A Multi-Agent LLM Framework for Automated Metamorphic Testing of Autonomous Driving Systems
- Title(参考訳): AutoMT:自律運転システムのメタモルフィック自動テストのためのマルチエージェントLLMフレームワーク
- Authors: Linfeng Liang, Chenkai Tan, Yao Deng, Yingfeng Cai, T. Y Chen, Xi Zheng,
- Abstract要約: AutoMTは、ローカルトラフィックルールからメタモルフィックリレーショナル(MR)を抽出するフレームワークである。
視覚言語エージェントがシナリオを分析し、検索エージェントがRAGベースのデータベースから適切なMRを取得し、フォローアップケースを生成する。
実験の結果, AutoMT は, 最良ベースラインと比較して, フォローアップケース生成において最大5倍の多様性を達成できることがわかった。
- 参考スコア(独自算出の注目度): 14.084623367678084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous Driving Systems (ADS) are safety-critical, where failures can be severe. While Metamorphic Testing (MT) is effective for fault detection in ADS, existing methods rely heavily on manual effort and lack automation. We present AutoMT, a multi-agent MT framework powered by Large Language Models (LLMs) that automates the extraction of Metamorphic Relations (MRs) from local traffic rules and the generation of valid follow-up test cases. AutoMT leverages LLMs to extract MRs from traffic rules in Gherkin syntax using a predefined ontology. A vision-language agent analyzes scenarios, and a search agent retrieves suitable MRs from a RAG-based database to generate follow-up cases via computer vision. Experiments show that AutoMT achieves up to 5 x higher test diversity in follow-up case generation compared to the best baseline (manual expert-defined MRs) in terms of validation rate, and detects up to 20.55% more behavioral violations. While manual MT relies on a fixed set of predefined rules, AutoMT automatically extracts diverse metamorphic relations that augment real-world datasets and help uncover corner cases often missed during in-field testing and data collection. Its modular architecture separating MR extraction, filtering, and test generation supports integration into industrial pipelines and potentially enables simulation-based testing to systematically cover underrepresented or safety-critical scenarios.
- Abstract(参考訳): ADS(Autonomous Driving Systems)は、障害が深刻になるような安全上重要なシステムである。
メタモルフィックテスト(MT)はADSの障害検出に有効であるが、既存の手法は手作業に大きく依存し、自動化が欠如している。
本稿では,局所的な交通ルールからメタモルフィック関係(MR)を抽出し,有効なフォローアップテストケースを生成する,Large Language Models (LLMs) を利用したマルチエージェントMTフレームワークであるAutoMTを提案する。
AutoMTはLLMを利用して、事前に定義されたオントロジーを使用して、Gherkin構文のトラフィックルールからMRを抽出する。
視覚言語エージェントがシナリオを分析し、検索エージェントがRAGベースのデータベースから適切なMRを取得し、コンピュータビジョンを介してフォローアップケースを生成する。
実験の結果、AutoMTは、最も優れたベースライン(手動のエキスパート定義MR)と比較して、フォローアップケース生成において最大5倍の多様性を達成し、最大20.55%の行動違反を検出することがわかった。
手動MTは、予め定義されたルールの固定セットに依存しているが、AutoMTは、現実世界のデータセットを増大させる多様なメタモルフィック関係を自動的に抽出し、フィールド内テストやデータ収集でしばしば見逃されるコーナーケースの発見を支援する。
MR抽出、フィルタリング、テスト生成を分離したモジュラーアーキテクチャは、産業用パイプラインへの統合をサポートし、シミュレーションベースのテストによって、未表現または安全クリティカルなシナリオを体系的にカバーできる可能性がある。
関連論文リスト
- AutoML in Cybersecurity: An Empirical Study [0.8703011045028926]
本稿では,11の公開サイバーセキュリティデータセットを対象とした8つのオープンソースAutoMLフレームワークを体系的に評価する。
結果は、ツールやデータセット間での大幅なパフォーマンスの変動を示しており、一貫して優れたソリューションは存在しない。
主な課題は、敵の脆弱性、モデルドリフト、不適切な機能エンジニアリングである。
論文 参考訳(メタデータ) (2025-09-28T03:52:46Z) - On Simulation-Guided LLM-based Code Generation for Safe Autonomous Driving Software [0.577182115743694]
オートマチック・ドライビング・システム(Automated Driving System, ADS)は、車両の環境の解釈に責任を負う安全クリティカルなソフトウェアシステムである。
ADSの開発には厳格なプロセスが必要で、車両に配備する前にコードを検証し、検証し、評価し、検証する。
本研究では,自動コード生成と評価のためのプロトタイプを開発し,評価した。
論文 参考訳(メタデータ) (2025-04-02T21:35:11Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z) - Towards a Complete Metamorphic Testing Pipeline [56.75969180129005]
システムアンダーテスト(SUT)の連続実行における入出力ペア間の関係を調べてテストオラクル問題に対処するメタモルフィックテスト(MT)
これらの関係は、メタモルフィック関係 (MRs) と呼ばれ、特定の入力変化に起因する期待される出力変化を規定する。
本研究の目的は,MR の生成,制約の定義,MR 結果の説明可能性の提供を支援する手法とツールの開発である。
論文 参考訳(メタデータ) (2023-09-30T10:49:22Z) - TARGET: Automated Scenario Generation from Traffic Rules for Testing Autonomous Vehicles via Validated LLM-Guided Knowledge Extraction [8.029974249105443]
TARGETは、トラフィックルールからテストシナリオを自動的に生成するエンドツーエンドフレームワークである。
交通ルールから知識を抽出するために,Large Language Model (LLM) を利用する。
TARGETはシナリオをシミュレーションでレンダリングするために実行可能なスクリプトを合成する。
論文 参考訳(メタデータ) (2023-05-10T10:04:08Z) - AutoEn: An AutoML method based on ensembles of predefined Machine
Learning pipelines for supervised Traffic Forecasting [1.6242924916178283]
交通予測(TF)は、将来の交通状況を予測することで交通渋滞を緩和する能力により、関連性が高まっている。
TFは、モデル選択問題(MSP)として知られる機械学習パラダイムに大きな課題を提起する。
事前に定義されたMLパイプラインの集合からマルチクラス化アンサンブルを自動生成する,シンプルで効率的な手法であるAutoEnを紹介する。
論文 参考訳(メタデータ) (2023-03-19T18:37:18Z) - Self-Supervised Representation Learning from Temporal Ordering of
Automated Driving Sequences [49.91741677556553]
本研究では、認識タスクのための地域レベルの特徴表現を事前学習するための時間順述前文タスクであるTempOを提案する。
我々は各フレームを、オブジェクト検出やトラッキングシステムにとって自然な表現である、未順序な特徴ベクトルのセットで埋め込む。
BDD100K、nu Images、MOT17データセットの大規模な評価は、私たちのTempO事前学習アプローチがシングルフレームの自己教師型学習方法よりも優れていることを示している。
論文 参考訳(メタデータ) (2023-02-17T18:18:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。