論文の概要: Beyond Fixed Thresholds and Domain-Specific Benchmarks for Explainable Multi-Task Classification in Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2605.04299v1
- Date: Tue, 05 May 2026 21:07:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.546063
- Title: Beyond Fixed Thresholds and Domain-Specific Benchmarks for Explainable Multi-Task Classification in Autonomous Vehicles
- Title(参考訳): 自律走行車における説明可能なマルチタスク分類のための固定閾値とドメイン特化ベンチマークを超えて
- Authors: Maryam Sadat Hosseini Azad, Shahriar Baradaran Shokouhi,
- Abstract要約: シーン理解は、ディープラーニングモデルの使用を必要とする自律運転システムにおいて重要な部分である。
本稿では,各タスクに対する最適決定境界を特定するために,様々なしきい値を評価する信頼しきい値感度分析を導入する。
IUST-XAI-ADは、人間のアノテーションを付加した958枚の画像からなる新しいデータセットである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scene understanding is a vital part of autonomous driving systems, which requires the use of deep learning models. Deep learning methods are intrinsically black box models, which lack transparency and safety in autonomous driving. To make these systems transparent, multi-task visual understanding has become crucial for explainable autonomous driving perception systems, where simultaneous prediction of multiple driving behaviors and their underlying explanations is essential for safe navigation and human trust in autonomous vehicles. In order to design an accurate and cross-cultural explainable autonomous driving system, we introduce a comprehensive confidence threshold sensitivity analysis that evaluates various threshold values to identify optimal decision boundaries for different tasks. Our analysis demonstrates that traditional fixed threshold approaches are suboptimal for multi-task scenarios. Through extensive evaluation, we demonstrate that our adaptive threshold selection methodology improves F1-scores across different tasks. In addition, we introduce IUST-XAI-AD, a novel dataset consisting of 958 images with human annotations for driving decisions and corresponding reasoning. This dataset addresses the critical gap in domain-specific evaluation benchmarks for distinct driving contexts and provides a more challenging test environment compared to existing datasets. Experimental results demonstrate that confidence threshold sensitivity analysis can significantly improve model performance, while the introduction of the IUST-XAI-AD dataset reveals important insights about cross-cultural driving behavior patterns. The combined contributions of this work provide both methodological advances and practical evaluation tools that can accelerate the development of more reliable, explainable, and culturally-adaptive autonomous driving systems for global deployment.
- Abstract(参考訳): シーン理解は、ディープラーニングモデルの使用を必要とする自律運転システムにおいて重要な部分である。
ディープラーニングは本質的にブラックボックスモデルであり、自律運転における透明性と安全性を欠いている。
これらのシステムを透過的にするためには、複数の運転行動の同時予測と、その基礎となる説明が、安全なナビゲーションと自動運転車に対する人間の信頼に不可欠である、説明可能な自律運転認識システムにおいて、マルチタスクの視覚的理解が不可欠になっている。
高精度で異文化横断的な自律運転システムを設計するために,様々なしきい値を評価する総合的信頼しきい値感度分析を導入し,タスクの最適決定境界を同定する。
本分析は,従来の固定しきい値アプローチがマルチタスクシナリオに最適であることを示す。
適応しきい値選択手法がF1スコアを様々なタスクで改善することを示す。
また,IUST-XAI-ADは,人間のアノテーションを付加した958枚の画像からなる新しいデータセットである。
このデータセットは、異なる駆動コンテキストに対するドメイン固有の評価ベンチマークの致命的なギャップに対処し、既存のデータセットと比較してより困難なテスト環境を提供する。
IUST-XAI-ADデータセットの導入は、異文化間運転行動パターンに関する重要な洞察を明らかにする一方で、信頼性閾値感度分析がモデル性能を著しく向上させることを示した。
本研究のコントリビューションは, より信頼性が高く, 説明可能な, 文化的に適応可能な自動運転システムの開発を加速する, 方法論的進歩と実践的評価ツールの両方を提供する。
関連論文リスト
- KnowVal: A Knowledge-Augmented and Value-Guided Autonomous Driving System [44.93698347738791]
視覚言語推論を可能にする新しい自律運転システムであるKnowValを提案する。
交通法則,防衛運転原則,倫理規範を符号化した総合運転知識グラフを構築した。
KnowVal は nuScene 上での衝突速度と Bench2Drive 上での最先端の結果を達成する。
論文 参考訳(メタデータ) (2025-12-23T12:08:00Z) - RAD: Retrieval-Augmented Decision-Making of Meta-Actions with Vision-Language Models in Autonomous Driving [10.984203470464687]
視覚言語モデル(VLM)は、空間認識の不十分さや幻覚といった限界に悩まされることが多い。
本稿では,自律走行シーンにおけるメタアクションを確実に生成するVLMの能力を高めるための,検索強化意思決定(RAD)フレームワークを提案する。
我々は,NuScenesデータセットから得られたデータセットに基づいてVLMを微調整し,その空間的知覚と鳥眼視画像理解能力を高める。
論文 参考訳(メタデータ) (2025-03-18T03:25:57Z) - DriveLMM-o1: A Step-by-Step Reasoning Dataset and Large Multimodal Model for Driving Scenario Understanding [76.3876070043663]
自律運転のための段階的視覚的推論を推し進めるためのデータセットとベンチマークであるDriveLMM-o1を提案する。
私たちのベンチマークでは、トレーニングセットに18k以上のVQAサンプル、テストセットに4k以上、知覚、予測、計画に関するさまざまな質問をカバーしています。
我々のモデルは、最終回答精度が+7.49%向上し、以前の最高のオープンソースモデルよりも3.62%向上した。
論文 参考訳(メタデータ) (2025-03-13T17:59:01Z) - SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
我々は、構造化されていない知識と構造化されていない知識の両方を取り入れることで、MLLMベースの自動運転を強化するフレームワークであるSafeAutoを提案する。
安全知識を明示的に統合するため,交通ルールを一階述語論理に変換する推論コンポーネントを開発した。
我々のマルチモーダル検索・拡張生成モデルは、過去の運転経験から学ぶために、ビデオ、制御信号、環境特性を活用する。
論文 参考訳(メタデータ) (2025-02-28T21:53:47Z) - Exploring the Causality of End-to-End Autonomous Driving [57.631400236930375]
本稿では,エンドツーエンド自動運転の因果関係を探究し,分析するための包括的アプローチを提案する。
私たちの研究は、エンドツーエンドの自動運転の謎を初めて明らかにし、ブラックボックスを白い箱に変えた。
論文 参考訳(メタデータ) (2024-07-09T04:56:11Z) - Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving [38.28159034562901]
Reason2Driveは600万以上のビデオテキストペアを備えたベンチマークデータセットである。
我々は、自律運転プロセスが知覚、予測、推論ステップの逐次的な組み合わせであると特徴付けている。
本稿では,自律システムにおける連鎖型推論性能を評価するための新しい集計評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-06T18:32:33Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。