論文の概要: Output Type Before Quality: A Standards-Derived XAI Admissibility Rubric for Autonomous-Driving Safety
- arxiv url: http://arxiv.org/abs/2606.05461v1
- Date: Wed, 03 Jun 2026 21:37:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.417833
- Title: Output Type Before Quality: A Standards-Derived XAI Admissibility Rubric for Autonomous-Driving Safety
- Title(参考訳): 品質前のアウトプットタイプ:自動運転安全のための標準開発されたXAI適応ゴム
- Authors: Abhinaw Priyadershi, Mandar Pitale, Jelena Frtunikj, Maria Spence,
- Abstract要約: MLベースの自律運転の安全基準は、保証事例が含まなければならない証拠の種類を規定している(直接因果連鎖、定量化された介入効果、根因変数)。
しかし、XAI文献は出力型と技法系(相性マップ、特徴属性、反事実、因果グラフ、言語トレース)で整理されている。
私たちはこのミスマッチをエビデンスタイプのギャップと呼んでいます。
安全保証のためのXAI手法の選択は,メソッドの人気ではなく,ライフサイクル段階のエビデンス要求によって行うべきである。
- 参考スコア(独自算出の注目度): 0.4958589793470846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safety standards for ML-based autonomous driving specify the kind of evidence an assurance case must contain (directed cause-and-effect chains, quantified interventional effects, named root-cause variables), yet the XAI literature is organised by output type and technique family (saliency maps, feature attribution, counterfactuals, causal graphs, language traces). SHAP, the most-recommended ADS XAI method, returns a ranked feature list that no implementation effort can convert into a directed chain (Fig.1). We name this mismatch the evidence-type gap. From AMLAS, ISO 26262, ISO21448, ISO/PAS 8800 we derive 19 testable evidentiary criteria across 7 lifecycle stages with representative clause-cited derivations and score six XAI method classes structurally. Causal XAI emerges as structurally required to satisfy the derived criteria at three stages: hazard identification (+62% rubric gap), incident investigation (+50%), and data management (+50%); the verdict set is stable across thresholds T in (0%, 50%]$ and survives a worst-case single-cell flip down to T = 25%. At the remaining four stages, correlational or language-based methods are comparable or sufficient. The rubric identifies structural admissibility (necessary but not sufficient for compliance): an admissible method's specific output content may still be wrong, and validating that fidelity (the edges a fitted SCM produces, the cause a trace names) is the open assurance challenge. A single-VLA proof of concept on 1,996 real-world driving clips (79,840 rows, ten splits) is consistent with each method's observed output type matching its rubric prediction. XAI method selection for ADS safety assurance should be driven by lifecycle-stage evidence demand, not by method popularity.
- Abstract(参考訳): MLベースの自律運転の安全基準は、保証事例が含まなければならない証拠の種類(直接因果関係、定量化された介入効果、ルート因果変数)を規定するが、XAI文献は出力タイプと技術ファミリー(可用性マップ、特徴属性、反事実グラフ、因果グラフ、言語トレース)によって整理される。
最も推奨されている ADS XAI メソッドである SHAP は、実装作業が直接チェーンに変換できないようなランク付けされた特徴リストを返す(第1図)。
私たちはこのミスマッチをエビデンスタイプのギャップと呼んでいます。
AMLAS, ISO 26262, ISO21448, ISO/PAS 8800から, 7つのライフサイクル段階にわたって19の証明可能な証拠基準を導出し, 6つのXAI法クラスを構造的に評価した。
リスク識別(+62%)、インシデント調査(+50%)、データ管理(+50%)の3段階において、導出基準を満たすために構造的に要求される。
残りの4つの段階では、相関や言語に基づく手法は同等か十分である。
ルーブリックは構造的許容性(コンプライアンスには必要だが不十分)を識別する: 許容メソッドの特定の出力内容がまだ間違っている可能性があり、その忠実さ(適合したSCMが生成するエッジ、トレース名の原因)がオープンな保証課題であることを検証する。
1,996個の実世界の運転クリップ(79,840行、10分割)に対する1つのVLA概念の証明は、そのルーリック予測に一致する各メソッドの観測出力タイプと一致している。
ADSの安全性確保のためのXAI手法の選択は、メソッドの人気ではなく、ライフサイクルステージのエビデンス要求によって行われるべきである。
関連論文リスト
- Automated Proving of Shannon-Type Entropy Inequalities via Fine-Tuned Language Models and Guided Tree Search [50.16356451328644]
シャノン型エントロピーの不等式を証明することは情報理論の基本的な課題である。
我々は,原子実証のステップを微調整した小規模大規模言語モデルがこのプロセスを自動化することができるか検討する。
GPT-5.5は0ショットプロンプトで1.7%のサンプルを解き、Psitipは33.3%のサンプルを解いた。
論文 参考訳(メタデータ) (2026-06-04T05:43:12Z) - Distributional Energy-Based Models for Uncertainty-Aware Structured LLM Reasoning [40.342912574072024]
大規模言語モデルは、旅行計画やコードソリューションのような構造化されたアウトプットを生成する。
個々の推論ステップは正しく見えるが、アウトプット全体が予算に違反したり、テストケースに失敗したり、あるいは以前の推論に矛盾することがある。
構造化LCM出力の検証のための決定論的解析制約付き学習品質スコアラを提案する。
論文 参考訳(メタデータ) (2026-05-15T17:08:27Z) - RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems [0.0]
本稿では,信頼性,指数性,感度,等価性,展開性に関する5次元事前デプロイ評価を提案する。
RISEDはオープンソースのPythonパッケージとしてリリースされ、既存の臨床AIレポート標準の量的検証を提供する。
論文 参考訳(メタデータ) (2026-05-13T02:17:13Z) - The Alignment Tax: Response Homogenization in Aligned LLMs and Its Implications for Uncertainty Estimation [1.8345614451086532]
RLHF 対応言語モデルは TruthfulQA 上で応答均質化を示す。
40-79%の質問は、10のi.i.d.サンプルに対して単一のセマンティッククラスタを生成する。
論文 参考訳(メタデータ) (2026-03-25T09:35:15Z) - Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.78357530675446]
人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文 参考訳(メタデータ) (2024-10-30T15:06:44Z) - Zero-Knowledge Proof of Traffic: A Deterministic and Privacy-Preserving Cross Verification Mechanism for Cooperative Perception Data [7.919995199824006]
本研究では、ゼロ知識の証明(zk-PoT)と呼ばれる新しい手法を提案する。
同じ車両に関する複数の独立した証明は、基底的真理、確率的、あるいは確率的評価に頼らずに、どの受信機でも決定論的に相互検証することができる。
提案手法は、ETSI(European Telecommunications Standards Institute)やISO(International Organization for Standardization)ITS(International Organization for Standardization)など、既存の業務に組み込むことができる。
論文 参考訳(メタデータ) (2023-12-13T07:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。