論文の概要: Evaluation of Large Language Models for Anomaly Detection in Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2509.05315v1
- Date: Fri, 29 Aug 2025 13:05:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-14 20:41:04.916947
- Title: Evaluation of Large Language Models for Anomaly Detection in Autonomous Vehicles
- Title(参考訳): 自律走行車における異常検出のための大規模言語モデルの評価
- Authors: Petros Loukas, David Bassir, Savvas Chatzichristofis, Angelos Amanatiadis,
- Abstract要約: この研究は、現在の自動運転車が失敗することが証明された現実のエッジケースにおいて、大きな言語モデル(LLM)を評価する。
提案アーキテクチャは、オープンな語彙オブジェクト検出器と、迅速なエンジニアリングと大規模言語モデルによる文脈推論を組み合わせたものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of large language models (LLMs) has pushed their boundaries to many applications in various domains. Recently, the research community has started to evaluate their potential adoption in autonomous vehicles and especially as complementary modules in the perception and planning software stacks. However, their evaluation is limited in synthetic datasets or manually driving datasets without the ground truth knowledge and more precisely, how the current perception and planning algorithms would perform in the cases under evaluation. For this reason, this work evaluates LLMs on real-world edge cases where current autonomous vehicles have been proven to fail. The proposed architecture consists of an open vocabulary object detector coupled with prompt engineering and large language model contextual reasoning. We evaluate several state-of-the-art models against real edge cases and provide qualitative comparison results along with a discussion on the findings for the potential application of LLMs as anomaly detectors in autonomous vehicles.
- Abstract(参考訳): 大規模言語モデル(LLM)の急速な進化は、その境界を様々な分野の多くのアプリケーションに広げている。
近年、研究コミュニティは、自動運転車、特にソフトウェアスタックの認識と計画において補完的なモジュールとして採用される可能性を評価し始めている。
しかし、それらの評価は、基礎的な真実の知識がなく、より正確には、現在の認識と計画アルゴリズムが評価対象のケースでどのように機能するかを、合成データセットや手動で駆動するデータセットに限られている。
このため、この研究は、現在の自動運転車が失敗することが証明された現実のエッジケースのLLMを評価する。
提案アーキテクチャは、オープンな語彙オブジェクト検出器と、迅速なエンジニアリングと大規模言語モデルによる文脈推論を組み合わせたものである。
我々は, 実端症例に対する最先端モデルの評価を行い, 定性比較結果と, 自律走行車における異常検出装置としてのLCMの応用の可能性について検討した。
関連論文リスト
- Foundation Models in Autonomous Driving: A Survey on Scenario Generation and Scenario Analysis [19.212494396144404]
シミュレーションおよびシナリオベースのテストは、自律運転システムの開発と検証のための重要なアプローチとして現れている。
ファンデーションモデルは、事前訓練された汎用AIモデルの新たな世代を表している。
本調査では,大規模言語モデル,視覚言語モデル,多モーダル大規模言語モデル,拡散モデル,自律走行シナリオの生成と解析のための世界モデルを含む統合分類法を提案する。
論文 参考訳(メタデータ) (2025-06-13T07:25:59Z) - STSBench: A Spatio-temporal Scenario Benchmark for Multi-modal Large Language Models in Autonomous Driving [16.602141801221364]
STSBenchは、自律運転のための視覚言語モデル(VLM)の総合的な理解をベンチマークするためのフレームワークである。
このベンチマークでは、複数のビューにまたがる43の多様なシナリオが特徴で、その結果、971人の人間による検証された複数選択の質問が生まれている。
徹底的な評価により、複雑な環境における基本的なトラフィックダイナミクスを推論する既存のモデルの能力の欠点が明らかになる。
論文 参考訳(メタデータ) (2025-06-06T16:25:22Z) - A Framework for a Capability-driven Evaluation of Scenario Understanding for Multimodal Large Language Models in Autonomous Driving [15.24721920935653]
MLLM(Multimodal large language model)は、自動運転の可能性を秘めている。
自律運転システムへの統合は、概念実証アプリケーションにおいて有望な結果を示す。
本稿では,自律運転におけるMLLMの能力駆動評価のための総合的枠組みを提案する。
論文 参考訳(メタデータ) (2025-03-14T13:43:26Z) - Automatic benchmarking of large multimodal models via iterative experiment programming [71.78089106671581]
本稿では,LMMの自動ベンチマークのための最初のフレームワークであるAPExを紹介する。
自然言語で表現された研究の質問に対して、APExは大きな言語モデル(LLM)と事前定義されたツールのライブラリを活用して、手元にあるモデルの一連の実験を生成する。
調査の現在の状況に基づいて、APExはどの実験を行うか、結果が結論を引き出すのに十分かどうかを選択する。
論文 参考訳(メタデータ) (2024-06-18T06:43:46Z) - DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral
Planning States for Autonomous Driving [69.82743399946371]
DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。
モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。
このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文 参考訳(メタデータ) (2023-12-14T18:59:05Z) - Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving [38.28159034562901]
Reason2Driveは600万以上のビデオテキストペアを備えたベンチマークデータセットである。
我々は、自律運転プロセスが知覚、予測、推論ステップの逐次的な組み合わせであると特徴付けている。
本稿では,自律システムにおける連鎖型推論性能を評価するための新しい集計評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-06T18:32:33Z) - LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。
本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文 参考訳(メタデータ) (2023-11-02T07:23:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。