論文の概要: RefAV: Towards Planning-Centric Scenario Mining
- arxiv url: http://arxiv.org/abs/2505.20981v2
- Date: Wed, 18 Jun 2025 20:32:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 14:57:52.007024
- Title: RefAV: Towards Planning-Centric Scenario Mining
- Title(参考訳): RefAV: 計画中心のシナリオマイニングを目指して
- Authors: Cainan Davidson, Deva Ramanan, Neehar Peri,
- Abstract要約: 伝統的なシナリオマイニング技術はエラーを起こしやすく、非常に時間を要する。
本稿では,1万種類の自然言語クエリの大規模データセットであるRefAVを紹介する。
その結果, ナイール構造を有するオフザシェルフ-Msは, 性能が劣ることがわかった。
- 参考スコア(独自算出の注目度): 45.37155349405482
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous Vehicles (AVs) collect and pseudo-label terabytes of multi-modal data localized to HD maps during normal fleet testing. However, identifying interesting and safety-critical scenarios from uncurated driving logs remains a significant challenge. Traditional scenario mining techniques are error-prone and prohibitively time-consuming, often relying on hand-crafted structured queries. In this work, we revisit spatio-temporal scenario mining through the lens of recent vision-language models (VLMs) to detect whether a described scenario occurs in a driving log and, if so, precisely localize it in both time and space. To address this problem, we introduce RefAV, a large-scale dataset of 10,000 diverse natural language queries that describe complex multi-agent interactions relevant to motion planning derived from 1000 driving logs in the Argoverse 2 Sensor dataset. We evaluate several referential multi-object trackers and present an empirical analysis of our baselines. Notably, we find that naively repurposing off-the-shelf VLMs yields poor performance, suggesting that scenario mining presents unique challenges. Lastly, we discuss our recent CVPR 2025 competition and share insights from the community. Our code and dataset are available at https://github.com/CainanD/RefAV/ and https://argoverse.github.io/user-guide/tasks/scenario_mining.html
- Abstract(参考訳): 自律走行車(AV)は、通常の艦隊試験中にHDマップにローカライズされたマルチモーダルデータの擬似ラベルテラバイトを収集する。
しかし、未計算の運転ログから興味深く安全に重要なシナリオを特定することは大きな課題である。
伝統的なシナリオマイニング技術はエラーを起こしやすく、しばしば手作りの構造化クエリに頼っている。
本研究では,最近の視覚言語モデル (VLM) のレンズを通して時空間的シナリオマイニングを再検討し,運転ログに記述されたシナリオが存在するかどうかを検知し,その場合,時間と空間の両方で正確に局所化する。
この問題に対処するために,Argoverse 2 Sensor データセットの1000の駆動ログから得られた動作計画に関連する複雑なマルチエージェントインタラクションを記述した,10,000の多様な自然言語クエリからなる大規模データセットであるRefAVを紹介した。
我々は,複数の参照多目的トラッカーを評価し,ベースラインの実証分析を行った。
特に,市販のVLMを自然に再利用すると性能が低下し,シナリオマイニングに固有の課題が生じることが示唆された。
最後に、CVPR 2025コンペティションについて議論し、コミュニティからの洞察を共有します。
私たちのコードとデータセットはhttps://github.com/CainanD/RefAV/とhttps://argoverse.github.io/user-guide/tasks/scenario_miningで公開されています。
関連論文リスト
- Spotting the Unexpected (STU): A 3D LiDAR Dataset for Anomaly Segmentation in Autonomous Driving [14.403130104985557]
本稿では,運転シナリオにおける異常セグメンテーションのための新しいデータセットを提案する。
これは、密集した3Dセマンティックラベリングによる道路異常セグメンテーションに焦点を当てた初めての公開データセットである。
データセットと評価コードは公開され、さまざまなアプローチのテストとパフォーマンスの比較が容易になります。
論文 参考訳(メタデータ) (2025-05-04T15:15:35Z) - Querying Labeled Time Series Data with Scenario Programs [0.0]
本稿では,実世界のラベル付き時系列データ項目とシミュレーションシナリオとの一致を形式的に定義する。
自動運転車の領域を超えてスケーラブルなマッチングを実現するための定義とアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-25T15:15:27Z) - NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking [65.24988062003096]
我々は,視覚に基づく運転ポリシーをベンチマークするフレームワークであるNAVSIMを提案する。
我々のシミュレーションは非反応性であり、評価された政策と環境は互いに影響を与えない。
NAVSIMはCVPR 2024で開催され、143チームが433のエントリーを提出し、いくつかの新たな洞察を得た。
論文 参考訳(メタデータ) (2024-06-21T17:59:02Z) - Graph Convolutional Networks for Complex Traffic Scenario Classification [0.7919810878571297]
シナリオベースのテストアプローチは、自動運転システムの安全性の統計的に重要な証拠を得るのに必要な時間を短縮することができる。
シナリオ分類のほとんどの方法は、多様な環境を持つ複雑なシナリオでは機能しない。
本研究では,車両と環境との相互作用をモデル化できる複雑な交通シナリオ分類手法を提案する。
論文 参考訳(メタデータ) (2023-10-26T20:51:24Z) - DeepAccident: A Motion and Accident Prediction Benchmark for V2X
Autonomous Driving [76.29141888408265]
本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。
提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文 参考訳(メタデータ) (2023-04-03T17:37:00Z) - Viewpoint-aware Progressive Clustering for Unsupervised Vehicle
Re-identification [36.60241974421236]
教師なし車両Re-IDのための視点対応クラスタリングアルゴリズムを提案する。
特に、まず、予測された視点に従って特徴空間全体を異なる部分空間に分割し、次に、サンプル間の正確な関係をマイニングするためにプログレッシブクラスタリングを行う。
論文 参考訳(メタデータ) (2020-11-18T05:40:14Z) - SoDA: Multi-Object Tracking with Soft Data Association [75.39833486073597]
マルチオブジェクトトラッキング(MOT)は、自動運転車の安全な配備の前提条件である。
観測対象間の依存関係をエンコードするトラック埋め込みの計算に注目するMOTに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:40:25Z) - When, Where, and What? A New Dataset for Anomaly Detection in Driving
Videos [9.638503179434581]
本稿では,エゴセントリックなビデオから異常なイベントを検出し,局所化し,認識するための,テキストオンリーパイプラインによるトラフィック異常検出を提案する。
本研究では,時間的,空間的,カテゴリー的アノテーションを備えた4,677本のビデオを含む,交通異常検出(DoTA)と呼ばれる新しいデータセットを提案する。
論文 参考訳(メタデータ) (2020-04-06T23:58:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。