論文の概要: From Human Intention to Action Prediction: A Comprehensive Benchmark for Intention-driven End-to-End Autonomous Driving
- arxiv url: http://arxiv.org/abs/2512.12302v1
- Date: Sat, 13 Dec 2025 11:59:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.208687
- Title: From Human Intention to Action Prediction: A Comprehensive Benchmark for Intention-driven End-to-End Autonomous Driving
- Title(参考訳): 人間の意図から行動予測へ:意図駆動型エンドツーエンド自動運転のための総合ベンチマーク
- Authors: Huan Zheng, Yucheng Zhou, Tianyi Yan, Jiayi Su, Hongjun Chen, Dubing Chen, Wencheng Han, Runzhou Tao, Zhongying Qiu, Jianfei Yang, Jianbing Shen,
- Abstract要約: 現在の自律運転システムは、単純な操縦命令に従うように、インテリジェンスレベルで動作する。
Intention-Driveは、高レベルの人間の意図を安全かつ正確な運転行動に変換する能力を評価するために設計された最初の総合的なベンチマークである。
- 参考スコア(独自算出の注目度): 67.23302649816466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current end-to-end autonomous driving systems operate at a level of intelligence akin to following simple steering commands. However, achieving genuinely intelligent autonomy requires a paradigm shift: moving from merely executing low-level instructions to understanding and fulfilling high-level, abstract human intentions. This leap from a command-follower to an intention-fulfiller, as illustrated in our conceptual framework, is hindered by a fundamental challenge: the absence of a standardized benchmark to measure and drive progress on this complex task. To address this critical gap, we introduce Intention-Drive, the first comprehensive benchmark designed to evaluate the ability to translate high-level human intent into safe and precise driving actions. Intention-Drive features two core contributions: (1) a new dataset of complex scenarios paired with corresponding natural language intentions, and (2) a novel evaluation protocol centered on the Intent Success Rate (ISR), which assesses the semantic fulfillment of the human's goal beyond simple geometric accuracy. Through an extensive evaluation of a spectrum of baseline models on Intention-Drive, we reveal a significant performance deficit, showing that the baseline model struggle to achieve the comprehensive scene and intention understanding required for this advanced task.
- Abstract(参考訳): 現在のエンドツーエンドの自動運転システムは、単純なステアリングコマンドに従うように、インテリジェンスレベルで動作する。
しかし、真にインテリジェントな自律を実現するには、単に低レベルの命令を実行することから、高レベルの抽象的な人間の意図を理解し、達成することへの移行というパラダイムシフトが必要である。
このコマンドフォロワから、概念的なフレームワークで説明されているように、インテンションフルフィルダへの飛躍は、この複雑なタスクの進捗を計測し、推進する標準ベンチマークが存在しないという、根本的な課題によって妨げられます。
この重要なギャップに対処するために、私たちは、高レベルの人間の意図を安全かつ正確な運転行動に変換する能力を評価するために設計された最初の包括的なベンチマークであるIntention-Driveを紹介します。
Intention-Driveは、(1)対応する自然言語の意図と組み合わせた複雑なシナリオの新しいデータセット、(2)単純な精度以上の人間のゴールの意味的満足度を評価するIntent Success Rate(ISR)を中心とした新しい評価プロトコル、の2つのコアコントリビューションを特徴としている。
Intention-Drive 上でのベースラインモデルのスペクトルを広範囲に評価することにより,この高度なタスクに必要な包括的シーンと意図的理解を達成するために,ベースラインモデルが困難であることを示す。
関連論文リスト
- Mimir: Hierarchical Goal-Driven Diffusion with Uncertainty Propagation for End-to-End Autonomous Driving [17.533465904228844]
そこで我々は,不確実性推定を伴うゴールポイントに依存するロバストな軌跡を生成可能な,新しい階層型デュアルシステムフレームワークであるMimirを提案する。
Mimirは従来の最先端の手法を20%改善し、ハイレベルなモジュール推論速度の1.6倍の改善を実現している。
論文 参考訳(メタデータ) (2025-12-08T03:31:25Z) - DriveCritic: Towards Context-Aware, Human-Aligned Evaluation for Autonomous Driving with Vision-Language Models [24.168614747778538]
DriveCriticは、2つの重要なコントリビューションを特徴とする新しいフレームワークです。
データセットは、コンテキストが正しい判断に不可欠である、困難なシナリオのキュレートされたコレクションである。
DriveCriticモデルは、視覚的コンテキストとシンボル的コンテキストを統合することで、軌跡ペア間の調整を学ぶ。
論文 参考訳(メタデータ) (2025-10-15T03:00:38Z) - IntentionVLA: Generalizable and Efficient Embodied Intention Reasoning for Human-Robot Interaction [51.130510883952546]
Vision-Language-Action(VLA)モデルは、事前訓練された視覚言語モデル(VLM)を活用して、ロボット制御との認識を両立させる。
カリキュラム学習パラダイムと効率的な推論機構を備えたVLAフレームワークである textbfIntentionVLA を提案する。
提案手法はまず,意図推論,空間的接地,コンパクトな具体的推論を組み合わせ,慎重に設計した推論データを活用する。
論文 参考訳(メタデータ) (2025-10-09T04:49:46Z) - ReAL-AD: Towards Human-Like Reasoning in End-to-End Autonomous Driving [27.75047397292818]
エンドツーエンドの自動運転は、単一のフレームワーク内で認識、予測、計画を統合するための有望なアプローチとして現れています。
本稿では,3階層の認知モデルに基づいて自律運転における意思決定を構造化するReAL-ADを提案する。
我々のフレームワークを統合することで、計画の正確さと安全性が30%以上向上し、エンドツーエンドの自動運転がより解釈可能になり、人間のような階層的推論に適合することを示します。
論文 参考訳(メタデータ) (2025-07-16T02:23:24Z) - ThinkBot: Embodied Instruction Following with Thought Chain Reasoning [66.09880459084901]
EIF(Embodied Instruction following)は、複雑な環境下でオブジェクトを相互作用させることで、エージェントが人間の指示を完了させる。
我々は,人間の指導における思考連鎖を原因とした思考ボットを提案し,その不足した行動記述を復元する。
私たちのThinkBotは、成功率と実行効率の両面で、最先端のEIFメソッドよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2023-12-12T08:30:09Z) - Planning-oriented Autonomous Driving [60.93767791255728]
我々は、最終目標、すなわち自動運転車の計画を追求するために、好ましいフレームワークを考案し、最適化すべきであると主張している。
フルスタック運転タスクをひとつのネットワークに組み込んだ総合的なフレームワークであるUnified Autonomous Driving (UniAD)を紹介した。
論文 参考訳(メタデータ) (2022-12-20T10:47:53Z) - Important Object Identification with Semi-Supervised Learning for
Autonomous Driving [37.654878298744855]
本稿では,エゴセントリック駆動シナリオにおける重要な物体識別のための新しい手法を提案する。
モデルが無制限なラベル付きデータから学習できるようにするための,半教師付き学習パイプラインを提案する。
私たちのアプローチはルールベースのベースラインよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2022-03-05T01:23:13Z) - An Information Bottleneck Approach for Controlling Conciseness in
Rationale Extraction [84.49035467829819]
我々は,情報ボトルネック(IB)の目的を最適化することで,このトレードオフをよりよく管理できることを示す。
我々の完全教師なしのアプローチは、文上のスパース二項マスクを予測する説明器と、抽出された合理性のみを考慮したエンドタスク予測器を共同で学習する。
論文 参考訳(メタデータ) (2020-05-01T23:26:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。