Fugu-MT 論文翻訳(概要): LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset

論文の概要: LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset

arxiv url: http://arxiv.org/abs/2603.23607v1
Date: Tue, 24 Mar 2026 18:00:08 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-26 21:06:10.970901
Title: LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset
Title（参考訳）: LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset
Authors: Royden Wagner, Omer Sahin Tas, Jaime Villa, Felix Hauser, Yinzhe Shen, Marlon Steiner, Dominik Strutz, Carlos Fernandez, Christian Kinzig, Guillermo S. Guitierrez-Cabello, Hendrik Königshof, Fabian Immel, Richard Schwarzkopf, Nils Alexander Rack, Kevin Rösch, Kaiwen Wang, Jan-Hendrik Pauls, Martin Lauer, Igor Gilitschenski, Holger Caesar, Christoph Stiller,
Abstract要約: このデータセットは、ロングテール駆動イベントに焦点を当てたエンドツーエンド駆動用に設計されている。マルチビュービデオデータ、トラジェクトリ、ハイレベルな命令、詳細な推論トレースを提供する。英語、スペイン語、中国語の多言語推論の痕跡は、様々な文化的背景を持つドメインの専門家から来ている。
参考スコア（独自算出の注目度）: 27.918252823416623
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In real-world domains such as self-driving, generalization to rare scenarios remains a fundamental challenge. To address this, we introduce a new dataset designed for end-to-end driving that focuses on long-tail driving events. We provide multi-view video data, trajectories, high-level instructions, and detailed reasoning traces, facilitating in-context learning and few-shot generalization. The resulting benchmark for multimodal models, such as VLMs and VLAs, goes beyond safety and comfort metrics by evaluating instruction following and semantic coherence between model outputs. The multilingual reasoning traces in English, Spanish, and Chinese are from domain experts with diverse cultural backgrounds. Thus, our dataset is a unique resource for studying how different forms of reasoning affect driving competence. Our dataset is available at: https://hf.co/datasets/kit-mrt/kitscenes-longtail
Abstract（参考訳）: 自動運転車のような現実世界の領域では、稀なシナリオへの一般化は依然として根本的な課題である。これを解決するために、長い運転イベントに焦点を当てたエンドツーエンド運転用に設計された新しいデータセットを導入する。マルチビュービデオデータ、トラジェクトリ、ハイレベルな命令、詳細な推論トレースを提供する。 VLMやVLAといったマルチモーダルモデルのベンチマークは、モデル出力間の命令追従とセマンティックコヒーレンスを評価することで、安全性と快適さの指標を超えている。英語、スペイン語、中国語の多言語推論の痕跡は、様々な文化的背景を持つドメインの専門家から来ている。このように、我々のデータセットは、異なる形の推論が運転能力にどのように影響するかを研究するためのユニークなリソースである。私たちのデータセットは、https://hf.co/datasets/kit-mrt/kitscenes-longtailで利用可能です。

関連論文リスト

Long Chain-of-Thought Reasoning Across Languages [14.79632337642471]
モデル開発の4つの重要な段階として,スケーリング,事前学習,ポストトレーニング,推論について検討する。スケーリング推論モデルのサイズはEn-CoTの多言語タスク性能を改善するが、Target-CoTのパフォーマンスは遅れている。英語以外の言語で高品質な推論トレースが不足していることを踏まえ,ポストトレーニングのための合成データキュレーション手法について検討する。
論文参考訳（メタデータ） (2025-08-20T16:22:51Z)
P-MMEval: A Parallel Multilingual Multitask Benchmark for Consistent Evaluation of LLMs [84.24644520272835]
本稿では,P-MMEvalを提案する。P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P-MMEval,P -M P-MMEvalは、さまざまなデータセットにわたって一貫した言語カバレッジを提供し、並列サンプルを提供する。我々は、モデルとタスク間の性能を比較するために、代表的多言語モデル系列に関する広範な実験を行う。
論文参考訳（メタデータ） (2024-11-14T01:29:36Z)
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI for Autonomous Driving [24.485164073626674]
各国から収集された100万件以上のデータを含む大規模データセットであるIDKBを提案する。運転免許取得のプロセスと同様に、IDKBは理論から実践への運転に必要な知識のほとんど全てを包含している。
論文参考訳（メタデータ） (2024-09-04T17:52:43Z)
CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving [0.4371652524921044]
CoVLA(Comprehensive Vision-Language-Action)データセットは、80時間以上にわたる現実世界の運転ビデオで構成されている。このデータセットは、堅牢で解釈可能で、データ駆動の自動運転システムのためのフレームワークを確立する。
論文参考訳（メタデータ） (2024-08-19T09:53:49Z)
UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文参考訳（メタデータ） (2024-03-22T10:36:50Z)
IDD-3D: Indian Driving Dataset for 3D Unstructured Road Scenes [79.18349050238413]
デプロイ可能なディープラーニングアーキテクチャの準備とトレーニングには、さまざまなトラフィックシナリオに適したモデルが必要である。インドなどいくつかの発展途上国で見られる非構造的で複雑な運転レイアウトは、これらのモデルに挑戦している。我々は、複数のカメラと12kの注釈付き駆動LiDARフレームを備えたLiDARセンサーのマルチモーダルデータからなる新しいデータセットIDD-3Dを構築した。
論文参考訳（メタデータ） (2022-10-23T23:03:17Z)
Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文参考訳（メタデータ） (2021-01-16T23:45:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。