Fugu-MT 論文翻訳(概要): RefAV: Towards Planning-Centric Scenario Mining

論文の概要: RefAV: Towards Planning-Centric Scenario Mining

arxiv url: http://arxiv.org/abs/2505.20981v2
Date: Wed, 18 Jun 2025 20:32:38 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-23 14:57:52.007024
Title: RefAV: Towards Planning-Centric Scenario Mining
Title（参考訳）: RefAV: 計画中心のシナリオマイニングを目指して
Authors: Cainan Davidson, Deva Ramanan, Neehar Peri,
Abstract要約: 伝統的なシナリオマイニング技術はエラーを起こしやすく、非常に時間を要する。本稿では,1万種類の自然言語クエリの大規模データセットであるRefAVを紹介する。その結果, ナイール構造を有するオフザシェルフ-Msは, 性能が劣ることがわかった。
参考スコア（独自算出の注目度）: 45.37155349405482
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Autonomous Vehicles (AVs) collect and pseudo-label terabytes of multi-modal data localized to HD maps during normal fleet testing. However, identifying interesting and safety-critical scenarios from uncurated driving logs remains a significant challenge. Traditional scenario mining techniques are error-prone and prohibitively time-consuming, often relying on hand-crafted structured queries. In this work, we revisit spatio-temporal scenario mining through the lens of recent vision-language models (VLMs) to detect whether a described scenario occurs in a driving log and, if so, precisely localize it in both time and space. To address this problem, we introduce RefAV, a large-scale dataset of 10,000 diverse natural language queries that describe complex multi-agent interactions relevant to motion planning derived from 1000 driving logs in the Argoverse 2 Sensor dataset. We evaluate several referential multi-object trackers and present an empirical analysis of our baselines. Notably, we find that naively repurposing off-the-shelf VLMs yields poor performance, suggesting that scenario mining presents unique challenges. Lastly, we discuss our recent CVPR 2025 competition and share insights from the community. Our code and dataset are available at https://github.com/CainanD/RefAV/ and https://argoverse.github.io/user-guide/tasks/scenario_mining.html
Abstract（参考訳）: 自律走行車(AV)は、通常の艦隊試験中にHDマップにローカライズされたマルチモーダルデータの擬似ラベルテラバイトを収集する。しかし、未計算の運転ログから興味深く安全に重要なシナリオを特定することは大きな課題である。伝統的なシナリオマイニング技術はエラーを起こしやすく、しばしば手作りの構造化クエリに頼っている。本研究では,最近の視覚言語モデル (VLM) のレンズを通して時空間的シナリオマイニングを再検討し,運転ログに記述されたシナリオが存在するかどうかを検知し,その場合,時間と空間の両方で正確に局所化する。この問題に対処するために,Argoverse 2 Sensor データセットの1000の駆動ログから得られた動作計画に関連する複雑なマルチエージェントインタラクションを記述した,10,000の多様な自然言語クエリからなる大規模データセットであるRefAVを紹介した。我々は,複数の参照多目的トラッカーを評価し,ベースラインの実証分析を行った。特に,市販のVLMを自然に再利用すると性能が低下し,シナリオマイニングに固有の課題が生じることが示唆された。最後に、CVPR 2025コンペティションについて議論し、コミュニティからの洞察を共有します。私たちのコードとデータセットはhttps://github.com/CainanD/RefAV/とhttps://argoverse.github.io/user-guide/tasks/scenario_miningで公開されています。

関連論文リスト

SMc2f: Robust Scenario Mining for Robotic Autonomy from Coarse to Fine [8.662817298688147]
RefAVは、大きな言語モデル(LLM)を使用して、空間的かつ時間的にシナリオをローカライズするエンドツーエンドフレームワークである。 SMc2fは、粗い画像テキストフィルタリングに視覚言語モデル(VLM)を使用するパイプラインである。公開データセットの実験は、検索品質と効率の両方において、かなりの向上を示している。
論文参考訳（メタデータ） (2026-01-17T11:25:55Z)
Time-RA: Towards Time Series Reasoning for Anomaly with LLM Feedback [55.284574165467525]
Time-RA(Time-Series Reasoning for Anomaly)は、時系列異常検出を生成的、推論集約的なタスクに変換する。また,実世界のマルチモーダルベンチマークデータセットであるRATs40Kを導入する。
論文参考訳（メタデータ） (2025-07-20T18:02:50Z)
Why Braking? Scenario Extraction and Reasoning Utilizing LLM [13.88343221678386]
シナリオ理解と推論にLarge Language Model(LLM)を利用する新しいフレームワークを提案する。提案手法は,低レベル数値信号と自然言語記述とのギャップを埋め,LLMによる運転シナリオの解釈と分類を可能にする。
論文参考訳（メタデータ） (2025-07-17T08:33:56Z)
Spotting the Unexpected (STU): A 3D LiDAR Dataset for Anomaly Segmentation in Autonomous Driving [14.403130104985557]
本稿では,運転シナリオにおける異常セグメンテーションのための新しいデータセットを提案する。これは、密集した3Dセマンティックラベリングによる道路異常セグメンテーションに焦点を当てた初めての公開データセットである。データセットと評価コードは公開され、さまざまなアプローチのテストとパフォーマンスの比較が容易になります。
論文参考訳（メタデータ） (2025-05-04T15:15:35Z)
Querying Labeled Time Series Data with Scenario Programs [0.0]
本稿では,実世界のラベル付き時系列データ項目とシミュレーションシナリオとの一致を形式的に定義する。自動運転車の領域を超えてスケーラブルなマッチングを実現するための定義とアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-06-25T15:15:27Z)
NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking [65.24988062003096]
我々は,視覚に基づく運転ポリシーをベンチマークするフレームワークであるNAVSIMを提案する。我々のシミュレーションは非反応性であり、評価された政策と環境は互いに影響を与えない。 NAVSIMはCVPR 2024で開催され、143チームが433のエントリーを提出し、いくつかの新たな洞察を得た。
論文参考訳（メタデータ） (2024-06-21T17:59:02Z)
DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文参考訳（メタデータ） (2024-06-06T18:12:04Z)
Graph Convolutional Networks for Complex Traffic Scenario Classification [0.7919810878571297]
シナリオベースのテストアプローチは、自動運転システムの安全性の統計的に重要な証拠を得るのに必要な時間を短縮することができる。シナリオ分類のほとんどの方法は、多様な環境を持つ複雑なシナリオでは機能しない。本研究では,車両と環境との相互作用をモデル化できる複雑な交通シナリオ分類手法を提案する。
論文参考訳（メタデータ） (2023-10-26T20:51:24Z)
DeepAccident: A Motion and Accident Prediction Benchmark for V2X Autonomous Driving [76.29141888408265]
本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文参考訳（メタデータ） (2023-04-03T17:37:00Z)
CODA: A Real-World Road Corner Case Dataset for Object Detection in Autonomous Driving [117.87070488537334]
我々は、ビジョンベース検出器のこの重要な問題を露呈する、CODAという挑戦的なデータセットを導入する。大規模自動運転データセットで訓練された標準物体検出器の性能は、mARの12.8%以下に著しく低下した。我々は最先端のオープンワールドオブジェクト検出器を実験し、CODAの新しいオブジェクトを確実に識別できないことを発見した。
論文参考訳（メタデータ） (2022-03-15T08:32:56Z)
Viewpoint-aware Progressive Clustering for Unsupervised Vehicle Re-identification [36.60241974421236]
教師なし車両Re-IDのための視点対応クラスタリングアルゴリズムを提案する。特に、まず、予測された視点に従って特徴空間全体を異なる部分空間に分割し、次に、サンプル間の正確な関係をマイニングするためにプログレッシブクラスタリングを行う。
論文参考訳（メタデータ） (2020-11-18T05:40:14Z)
SoDA: Multi-Object Tracking with Soft Data Association [75.39833486073597]
マルチオブジェクトトラッキング(MOT)は、自動運転車の安全な配備の前提条件である。観測対象間の依存関係をエンコードするトラック埋め込みの計算に注目するMOTに対する新しいアプローチを提案する。
論文参考訳（メタデータ） (2020-08-18T03:40:25Z)
When, Where, and What? A New Dataset for Anomaly Detection in Driving Videos [9.638503179434581]
本稿では,エゴセントリックなビデオから異常なイベントを検出し,局所化し,認識するための,テキストオンリーパイプラインによるトラフィック異常検出を提案する。本研究では,時間的,空間的,カテゴリー的アノテーションを備えた4,677本のビデオを含む,交通異常検出(DoTA)と呼ばれる新しいデータセットを提案する。
論文参考訳（メタデータ） (2020-04-06T23:58:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。