論文の概要: Neuro-Symbolic Drive: Rule-Grounded Faithful Reasoning for Driving VLAs
- arxiv url: http://arxiv.org/abs/2606.23938v1
- Date: Mon, 22 Jun 2026 20:57:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.688643
- Title: Neuro-Symbolic Drive: Rule-Grounded Faithful Reasoning for Driving VLAs
- Title(参考訳): ニューロシンボリックドライブ:VLA駆動のためのルール付き忠実推論
- Authors: Xiangbo Gao, Xiukun Huang, Boyu Lu, Junge Zhang, Mengjie Mao, Jiachen Li, Wei Xiong, Zhengzhong Tu,
- Abstract要約: 本稿では、ルール付き推論トレースで駆動VLAを監督する、ニューロシンボリック駆動フレームワークであるNeuro-Symbolic Driveを紹介する。
私たちのキーとなる観察は、ルールベースのプランナーは、すでに実行可能な推論エンジンとして機能している象徴的なAIシステムであるということです。
これらのトレースは、アクションを決定するプランナー状態から直接導かれるため、推論が構造的に構築によって運動生成と結合されることが保証される。
- 参考スコア(独自算出の注目度): 32.34223412562161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Driving VLA models incorporating Chain-of-Thought (CoT) reasoning are attractive because they leverage pretrained VLM representations and expose intermediate decisions in natural language, yet current rationales often lack the step-by-step decision semantics needed to keep the rationale causally connected to the planned motion. We introduce Neuro-Symbolic Drive, a neuro-symbolic driving framework that supervises a driving VLA with rule-grounded reasoning traces extracted directly from classical rule-based planners. Our key observation is that rule-based planners are symbolic AI systems that already function as executable reasoning engines: they reason about active safety constraints, search over candidate maneuvers, and select a final trajectory. We instrument these planners in simulation to capture both the executed trajectory and the internal decision trace at each rule-evaluation step. Each trace is serialized into structured rule-grounded reasoning and paired with the trajectory to fine-tune Qwen3.5-4B as a driving VLA. Because these traces are derived directly from the planner states that determine the action, they ensure reasoning is structurally coupled to motion generation by construction, rather than by post-hoc alignment. On our simulator-generated benchmark, detailed rule-grounded reasoning reduces ADE@3s from 0.47 to 0.26 and miss rate from 8.30% to 6.40% under three-camera perception, and from 0.54 to 0.26 and 10.13% to 5.99% under eight-camera perception. Neuro-Symbolic Drive thus converts neuro-symbolic planning logic into structured supervision. Code base: https://github.com/XiangboGaoBarry/Neural-Symbolic-Drive.
- Abstract(参考訳): CoT(Chain-of-Thought)推論を取り入れたVLAモデルを駆動することは、事前訓練されたVLM表現を活用し、自然言語の中間決定を公開することによって魅力的である。
本稿では,古典的ルールベースプランナーから直接抽出したルール付き推論トレースを用いて,運転VLAを監督するニューロシンボリック駆動フレームワークであるNeuro-Symbolic Driveを紹介する。
私たちのキーとなる観察は、ルールベースのプランナーは、すでに実行可能な推論エンジンとして機能している象徴的なAIシステムであるということです。
シミュレーションでは,各ルール評価ステップにおいて,実行された軌道と内部決定トレースの両方を捕捉する。
各トレースは、構造化されたルール基底推論にシリアライズされ、軌道とペアして、駆動VLAとしてQwen3.5-4Bを微調整する。
これらのトレースは、アクションを決定するプランナー状態から直接導かれるため、推論がポストホックアライメントではなく、構造的に構成によって運動生成と結合されることが保証される。
シミュレーションで作成したベンチマークでは、ADE@3sを0.47から0.26に、ミス率は8.30%から6.40%に減らし、0.54から0.26と10.13%から5.99%に減らした。
これにより、ニューロシンボリックドライブは、ニューロシンボリックプランニングロジックを構造化された監視に変換する。
コードベース:https://github.com/XiangboGaoBarry/Neural-Symbolic-Drive
関連論文リスト
- OneVL: One-Step Latent Reasoning and Planning with Vision-Language Explanation [61.18260993245354]
Chain-of-Thought(CoT)推論は、VLAベースの自律運転において、軌道予測の強力なドライバである。
本稿では,2つの補助デコーダによって制御されるコンパクトな潜在トークンを通じて推論をルーティングする,統一VLAおよびワールドモデルフレームワークであるOneVLを提案する。
OneVLは、明示的なCoTを超える最初の遅延CoTメソッドとなり、応答のみのレイテンシで最先端の精度を提供する。
論文 参考訳(メタデータ) (2026-04-20T16:37:22Z) - A Neuro-Symbolic Framework Combining Inductive and Deductive Reasoning for Autonomous Driving Planning [11.4334803806548]
本稿では、厳密な推論をエンドツーエンドのニューラルネットワークにシームレスに統合する新しいニューロシンボリック・トラジェクトリ・プランニング・フレームワークを提案する。
具体的には,Large Language Model (LLM) を用いてシーンルールを動的に抽出する。
また、高いレベルの論理的決定を学習可能な埋め込みベクトルに変換する決定条件の復号化機構も導入する。
論文 参考訳(メタデータ) (2026-03-12T20:09:18Z) - Reasoning is a Modality [4.055765634948606]
人間の知性に中心的な能力である抽象的推論を研究する。
現代のAIシステムは、行動予測マシンとして動作する。
人間は内部状態の復号化によって行動を説明することができ、一方AIシステムは流動的なポストホックな合理化を生成することができる。
論文 参考訳(メタデータ) (2026-01-20T03:37:17Z) - Counterfactual VLA: Self-Reflective Vision-Language-Action Model with Adaptive Reasoning [71.19675094463834]
この作業では、モデルが実行前に計画されたアクションを推論し、修正することを可能にする、自己修正型のVLAフレームワークである、Counterfactual VLAを導入している。
CF-VLAはまず、駆動意図を要約した時間分割メタアクションを生成し、その後、メタアクションと視覚コンテキストの両方で条件付けられた反実的推論を実行する。
大規模運転データセットの実験では、CF-VLAは軌道精度を最大17.6%向上し、安全基準を20.5%向上し、適応的思考を示す。
論文 参考訳(メタデータ) (2025-12-30T19:04:17Z) - Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long Tail [85.47497935739936]
Alpamayo-R1 (AR1) は、因果推論の連鎖と軌道計画を統合する視覚言語モデルである。
また,AR1は,軌道のみのベースラインに比べて,難問の計画精度が12%向上することを示した。
今後のアップデートで、AR1モデルとCoCのサブセットをリリースする予定です。
論文 参考訳(メタデータ) (2025-10-30T01:25:34Z) - ZTRS: Zero-Imitation End-to-end Autonomous Driving with Trajectory Scoring [52.195295396336526]
ZTRS(Zero-Imitation End-to-End Autonomous Driving with Trajectory Scoring)は、情報を失うことなくセンサー入力と堅牢な計画のためのRLトレーニングという、両方の世界の強みを組み合わせたフレームワークである。
ZTRSは、Navtest、Navhard、HUGSIMの3つのベンチマークで強力なパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-10-28T06:26:36Z) - Align2Act: Instruction-Tuned Models for Human-Aligned Autonomous Driving [0.0]
そこで我々は,Align2Actを提案する。Align2Actは,命令付き言語モデルを人間の行動に合わせた解釈可能なプランナーに変換する動き計画フレームワークである。
nuPlanデータセットから100万のシナリオ上でLLaMA-2-7BをLoRAで微調整することにより,Test14-randomのオープンループスコア85.17,クローズループスコア70.31,66.96を達成できる。
合成またはオープンループ設定に重点を置いた以前の作業とは異なり、実際のnuPlanクローズドループベンチマークにおいて、計画品質と人間的類似性が改善された。
論文 参考訳(メタデータ) (2025-10-12T08:50:34Z) - ReAL-AD: Towards Human-Like Reasoning in End-to-End Autonomous Driving [27.75047397292818]
エンドツーエンドの自動運転は、単一のフレームワーク内で認識、予測、計画を統合するための有望なアプローチとして現れています。
本稿では,3階層の認知モデルに基づいて自律運転における意思決定を構造化するReAL-ADを提案する。
我々のフレームワークを統合することで、計画の正確さと安全性が30%以上向上し、エンドツーエンドの自動運転がより解釈可能になり、人間のような階層的推論に適合することを示します。
論文 参考訳(メタデータ) (2025-07-16T02:23:24Z) - Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models [86.88657425848547]
大型推論モデル(LRMs)はすでに長い連鎖推論のための潜在能力を持っている。
我々は、自動生成の自己検証タスクを使用して、モデルに推論、帰納、誘拐の3つのメタ能力を持たせることを明確にした。
我々の3つのステージ・パイプラインの個別アライメント、パラメータ空間のマージ、ドメイン固有の強化学習は、命令調整ベースラインと比較して10%以上のパフォーマンス向上を実現します。
論文 参考訳(メタデータ) (2025-05-15T17:58:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。