論文の概要: AGENTS-LLM: Augmentative GENeration of Challenging Traffic Scenarios with an Agentic LLM Framework
- arxiv url: http://arxiv.org/abs/2507.13729v1
- Date: Fri, 18 Jul 2025 08:20:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.221374
- Title: AGENTS-LLM: Augmentative GENeration of Challenging Traffic Scenarios with an Agentic LLM Framework
- Title(参考訳): AgentS-LLM:Augmentative generation of Challenging Traffic Scenarios with a Agentic LLM Framework
- Authors: Yu Yao, Salil Bhatnagar, Markus Mazzola, Vasileios Belagiannis, Igor Gilitschenski, Luigi Palmieri, Simon Razniewski, Marcel Hallgarten,
- Abstract要約: 本稿では,自然言語記述を用いた実世界の交通シナリオを拡張するためのLLM-agentベースのフレームワークを提案する。
重要な革新はエージェント設計を使用することで、出力のきめ細かい制御を可能にすることである。
- 参考スコア(独自算出の注目度): 29.10278896946722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rare, yet critical, scenarios pose a significant challenge in testing and evaluating autonomous driving planners. Relying solely on real-world driving scenes requires collecting massive datasets to capture these scenarios. While automatic generation of traffic scenarios appears promising, data-driven models require extensive training data and often lack fine-grained control over the output. Moreover, generating novel scenarios from scratch can introduce a distributional shift from the original training scenes which undermines the validity of evaluations especially for learning-based planners. To sidestep this, recent work proposes to generate challenging scenarios by augmenting original scenarios from the test set. However, this involves the manual augmentation of scenarios by domain experts. An approach that is unable to meet the demands for scale in the evaluation of self-driving systems. Therefore, this paper introduces a novel LLM-agent based framework for augmenting real-world traffic scenarios using natural language descriptions, addressing the limitations of existing methods. A key innovation is the use of an agentic design, enabling fine-grained control over the output and maintaining high performance even with smaller, cost-effective LLMs. Extensive human expert evaluation demonstrates our framework's ability to accurately adhere to user intent, generating high quality augmented scenarios comparable to those created manually.
- Abstract(参考訳): 希少だが重要なシナリオは、自律運転プランナのテストと評価において重大な課題を生じさせる。
現実の運転シーンだけに頼るには、これらのシナリオを捉えるために大量のデータセットを集める必要がある。
自動的なトラフィックシナリオの生成は有望なように見えるが、データ駆動モデルは広範なトレーニングデータを必要とし、出力に対するきめ細かい制御を欠いていることが多い。
さらに、スクラッチから新しいシナリオを生成することは、特に学習ベースのプランナーにとって評価の妥当性を損なう元のトレーニングシーンから、分散的なシフトをもたらす可能性がある。
これを回避するために、最近の研究は、テストセットからオリジナルのシナリオを拡張することで、難しいシナリオを生成することを提案している。
しかし、これはドメインの専門家によるシナリオのマニュアル拡張を伴う。
自動運転システムの評価においてスケール要求を満たすことができないアプローチ。
そこで本稿では,自然言語記述を用いた現実の交通シナリオを拡張し,既存の手法の限界に対処する,新たなLCMエージェントベースのフレームワークを提案する。
重要な革新はエージェント設計を使用することで、より小さくコスト効率のよいLCMでも、出力のきめ細かい制御と高性能の維持を可能にしている。
広範囲にわたる人間専門家の評価は、我々のフレームワークがユーザ意図に正確に準拠する能力を示し、手作業で作成されたものと同等の高品質な拡張シナリオを生成します。
関連論文リスト
- Test Automation for Interactive Scenarios via Promptable Traffic Simulation [48.240394447516664]
本稿では,対話型シナリオにおけるAVプランナ評価のための,現実的かつ安全クリティカルな人間の行動を生成する自動化手法を提案する。
我々は低次元目標位置を用いて複雑な人間の行動のパラメータ化を行い、それをプロンプト可能な交通シミュレータProSimに入力する。
テスト生成を自動化するために,目標領域を探索し,ベイズ最適化を用いて安全クリティカルな動作を効率的に識別するプロンプト生成モジュールを導入する。
論文 参考訳(メタデータ) (2025-06-01T22:29:32Z) - LD-Scene: LLM-Guided Diffusion for Controllable Generation of Adversarial Safety-Critical Driving Scenarios [3.6585028071015007]
LD-Sceneは、Large Language Models (LLMs)とLatent Diffusion Models (LDMs)を統合する新しいフレームワークである。
提案手法は,現実的な運転分布をキャプチャするLCMと,ユーザクエリを逆損失関数に変換するLCMベースのガイダンスモジュールを備える。
我々のフレームワークは、敵行動のきめ細かい制御を提供し、特定の運転シナリオに合わせたより効果的なテストを容易にする。
論文 参考訳(メタデータ) (2025-05-16T13:41:05Z) - Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - From Words to Collisions: LLM-Guided Evaluation and Adversarial Generation of Safety-Critical Driving Scenarios [6.681744368557208]
大規模言語モデル(LLM)と構造化シナリオ解析と迅速なエンジニアリングは、安全クリティカルな運転シナリオを生成するために使用される。
2次元シミュレーションフレームワークと複数の事前学習LDMを用いて,本手法の有効性を検証した。
ドメインインフォームドプロンプト技術を備えたLLMは、安全クリティカルな運転シナリオを効果的に評価し、生成することができると結論付けている。
論文 参考訳(メタデータ) (2025-02-04T09:19:13Z) - Generating Out-Of-Distribution Scenarios Using Language Models [58.47597351184034]
大規模言語モデル(LLM)は自動運転において有望であることを示している。
本稿では,多様なOF-Distribution(OOD)駆動シナリオを生成するためのフレームワークを提案する。
我々は、広範囲なシミュレーションを通じてフレームワークを評価し、新しい"OOD-ness"メトリクスを導入する。
論文 参考訳(メタデータ) (2024-11-25T16:38:17Z) - Multimodal Large Language Model Driven Scenario Testing for Autonomous Vehicles [6.836108615628114]
我々はシミュレーション環境で現実的で多様なシナリオを生成するフレームワークであるOmniTesterを提案する。
実験では,3種類の難解かつ複雑なシナリオを生成する上で,我々のアプローチの可制御性とリアリズムを実証した。
論文 参考訳(メタデータ) (2024-09-10T12:12:09Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - RealGen: Retrieval Augmented Generation for Controllable Traffic Scenarios [58.62407014256686]
RealGenは、トラフィックシナリオ生成のための新しい検索ベースのコンテキスト内学習フレームワークである。
RealGenは、複数の検索されたサンプルの振る舞いを勾配のない方法で組み合わせることで、新しいシナリオを合成する。
このコンテキスト内学習フレームワークは、シナリオを編集する機能を含む多種多様な生成機能を提供する。
論文 参考訳(メタデータ) (2023-12-19T23:11:06Z) - Generating Useful Accident-Prone Driving Scenarios via a Learned Traffic
Prior [135.78858513845233]
STRIVEは、特定のプランナーが衝突のような望ましくない振る舞いを発生させるような、困難なシナリオを自動的に生成する手法である。
シナリオの妥当性を維持するために、キーとなるアイデアは、グラフベースの条件付きVAEという形で、学習した交通運動モデルを活用することである。
その後の最適化は、シナリオの"解決"を見つけるために使用され、与えられたプランナーを改善するのに有効である。
論文 参考訳(メタデータ) (2021-12-09T18:03:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。