論文の概要: Is VLA Reasoning Faithful? Probing Safety of Chain-of-Causation in Autonomous Driving Models
- arxiv url: http://arxiv.org/abs/2605.17268v2
- Date: Sun, 24 May 2026 13:03:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:32:37.567361
- Title: Is VLA Reasoning Faithful? Probing Safety of Chain-of-Causation in Autonomous Driving Models
- Title(参考訳): VLA推論は忠実か? : 自律運転モデルにおけるチェーン・オブ・カウンセレーションの安全性
- Authors: Nicanor Mayumu, Xiaoheng Deng, Patrick Mukala,
- Abstract要約: 我々は,100種類の物理AI-AVシナリオを対象とした300個のAlpamayo-R1-10B推論を解析した。
全体的な推論の忠実さは42.5%に過ぎず、カオス・オブ・カウセーションのマッチングシーンの現実は半分以下である。
我々は、信頼度情報理論を定式化し、検証基準付きでエンティティとアクションの忠実度を定義し、これらの結果に沿った4成分安全アーキテクチャを概説する。
- 参考スコア(独自算出の注目度): 13.085985443741412
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present the first systematic study of faithfulness in Vision-Language-Action (VLA) driving models, analyzing 300 Alpamayo-R1-10B inferences across 100 diverse PhysicalAI-AV scenarios. Our main finding is that output natural-language rationales with trajectories may be significantly unfaithful: (i) overall reasoning fidelity is only 42.5%, with Chain-of-Causation matching scene reality less than half the time; (ii) 94 missed pedestrians in one-third of pedestrian-relevant scenes; (iii) 97.7% trajectory fragility under mild visual perturbations; and (iv) only 48.3% mean reasoning-action consistency, with 53.3% of inferences exhibiting low consistency, including 37.9% of stop-claimed cases where the model continues instead. We formalize faithfulness information-theoretically, define entity and action fidelity with verification criteria, and outline a four-component safety architecture aligned with these results.
- Abstract(参考訳): 本稿では,100種類の物理AI-AVシナリオを対象とした300のAlpamayo-R1-10B推論を解析し,VLA(Vision-Language-Action)駆動モデルにおける忠実度に関する最初の体系的研究について述べる。
我々の主な発見は、トラジェクトリーによるアウトプット自然言語の有理性は、著しく不信であるかもしれないということである。
(i)全体的推論忠実度は42.5%に過ぎず、カオス・オブ・カウセーション整合シーン現実は半分以下である。
(II)歩行者関連シーンの3分の1で94人が行方不明。
三 軽度視覚摂動時の軌道不安定度97.7%
(4)48.3%は推論-行動整合性であり、53.3%は低整合性を示し、37.9%はモデルが継続する。
我々は、信頼度情報理論を定式化し、検証基準付きでエンティティとアクションの忠実度を定義し、これらの結果に沿った4成分安全アーキテクチャを概説する。
関連論文リスト
- Measuring the Authority Stack of AI Systems: Empirical Analysis of 366,120 Forced-Choice Responses Across 8 AI Models [3.7184769644515896]
オーソリティスタックフレームワークの3つのレイヤすべてにまたがる、AI意思決定に関する大規模な実証的なマッピングを初めて紹介する。
温度0では8つの主要なAIモデルを評価し、366,120の回答を得た。
論文 参考訳(メタデータ) (2026-04-13T09:13:32Z) - Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [66.97968363332465]
エージェントベンチマークの3つのギャップに対処するエンドツーエンド評価スイートであるClaw-Evalを紹介した。
Claw-Evalは3つのグループにまたがる9つのカテゴリにまたがる300の人間検証タスクで構成されている。
すべてのエージェントアクションは、3つの独立したエビデンスチャネルを通じて記録される。
論文 参考訳(メタデータ) (2026-04-07T17:43:18Z) - Lie to Me: How Faithful Is Chain-of-Thought Reasoning in Reasoning Models? [0.0]
CoT(Chain-of- Thought)推論は、安全クリティカルなデプロイメントにおける大規模言語モデルの透明性メカニズムとして提案されている。
本研究では,9つの建築家族を対象としたオープンウェイト推論モデルを498の質問に対して検討した。
41,832回の推論では、全体の忠実度は39.7% (Seed-1.6-Flash) から89.9% (DeepSeek-V3.2- Speciale) まで変化している。
論文 参考訳(メタデータ) (2026-03-23T21:21:37Z) - AILS-NTUA at SemEval-2026 Task 12: Graph-Based Retrieval and Reflective Prompting for Abductive Event Reasoning [14.20669481486209]
本稿では,SemEval 2026 Task12: Abductive Event Reasoningの3段階制について述べる。
本システムでは, 評価フェーズのリーダーボードにおいて, 精度スコア0.95でランク付けする。
論文 参考訳(メタデータ) (2026-03-04T17:38:52Z) - CoT4Det: A Chain-of-Thought Framework for Perception-Oriented Vision-Language Tasks [53.88194225946438]
Chain-of-Thought for Detection (CoT4Det)は、知覚タスクを3つの解釈可能なステップに再構成するシンプルだが効率的な戦略である。
一般的な視覚言語能力を損なうことなく,CoT4Detは認識性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2025-12-07T05:26:30Z) - Beyond Mimicry: Preference Coherence in LLMs [0.19116784879310025]
大規模言語モデルが真の嗜好構造を示すかどうかを,AI固有のトレードオフに対する応答をテストすることによって検討する。
23の組合せ(47.9%)は、シナリオ強度と選択パターンの統計的に有意な関係を示した。
5つの組み合わせ(10.4%)だけが適応的またはしきい値に基づく行動を通じて有意義な嗜好コヒーレンスを示す。
不安定な遷移(45.8%)と刺激特異的感性は、現在のAIシステムが統一された嗜好構造を欠いていることを示唆している。
論文 参考訳(メタデータ) (2025-11-17T17:41:48Z) - Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail [85.47497935739936]
Alpamayo-R1 (AR1) は、因果推論の連鎖と軌道計画を統合する視覚言語モデルである。
また,AR1は,軌道のみのベースラインに比べて,難問の計画精度が12%向上することを示した。
今後のアップデートで、AR1モデルとCoCのサブセットをリリースする予定です。
論文 参考訳(メタデータ) (2025-10-30T01:25:34Z) - SAVANT: Semantic Analysis with Vision-Augmented Anomaly deTection [6.806105013817923]
SAVANTは、異常運転シナリオの検出において高精度なリコールを実現する構造化推論フレームワークである。
9,640以上の実世界の画像を高精度にラベル付けすることで、SAVANTは異常検出における重要なデータ不足問題に対処する。
論文 参考訳(メタデータ) (2025-10-20T19:14:29Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.78357530675446]
人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文 参考訳(メタデータ) (2024-10-30T15:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。