論文の概要: EagleVision: A Multi-Task Benchmark for Cross-Domain Perception in High-Speed Autonomous Racing
- arxiv url: http://arxiv.org/abs/2604.11400v1
- Date: Mon, 13 Apr 2026 12:42:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.535803
- Title: EagleVision: A Multi-Task Benchmark for Cross-Domain Perception in High-Speed Autonomous Racing
- Title(参考訳): EagleVision: 高速自律走行におけるクロスドメイン知覚のためのマルチタスクベンチマーク
- Authors: Zakhar Yagudin, Murad Mebrahtu, Ren Jin, Jiaqi Huang, Yujia Yue, Dzmitry Tsetserukou, Jorge Dias, Majid Khonji,
- Abstract要約: EagleVisionは、高速レースにおける3D検出と軌道予測のためのLiDARベースの統一ベンチマークである。
Indy Autonomous ChallengeデータセットとA2RL Realコンペティションデータセット用に、新たにアノテーション付き3Dバウンディングボックスを提供する。
データセット中心の転送フレームワークを用いて、都市域、シミュレーター、および実際のレース領域にわたるクロスドメインの一般化を定量化する。
- 参考スコア(独自算出の注目度): 9.483261915968617
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: High-speed autonomous racing presents extreme perception challenges, including large relative velocities and substantial domain shifts from conventional urban-driving datasets. Existing benchmarks do not adequately capture these high-dynamic conditions. We introduce EagleVision, a unified LiDAR-based multi-task benchmark for 3D detection and trajectory prediction in high-speed racing, providing newly annotated 3D bounding boxes for the Indy Autonomous Challenge dataset (14,893 frames) and the A2RL Real competition dataset (1,163 frames), together with 12,000 simulator-generated annotated frames, all standardized under a common evaluation protocol. Using a dataset-centric transfer framework, we quantify cross-domain generalization across urban, simulator, and real racing domains. Urban pretraining improves detection over scratch training (NDS 0.72 vs. 0.69), while intermediate pretraining on real racing data achieves the best transfer to A2RL (NDS 0.726), outperforming simulator-only adaptation. For trajectory prediction, Indy-trained models surpass in-domain A2RL training on A2RL test sequences (FDE 0.947 vs. 1.250), highlighting the role of motion-distribution coverage in cross-domain forecasting. EagleVision enables systematic study of perception generalization under extreme high-speed dynamics. The dataset and benchmark are publicly available at https://avlab.io/EagleVision
- Abstract(参考訳): 高速自動レースは、大規模な相対速度や従来の都市走行データセットからの領域シフトなど、極端な知覚上の課題を呈する。
既存のベンチマークは、これらの高ダイナミックな条件を適切に捉えていない。
Indy Autonomous Challenge データセット (14,893 フレーム) と A2RL Real 競合データセット (1,163 フレーム) に新たにアノテーション付き3次元バウンディングボックスを提供する。
データセット中心の転送フレームワークを用いて、都市域、シミュレーター、および実際のレース領域にわたるクロスドメインの一般化を定量化する。
都市プレトレーニングは、スクラッチトレーニングによる検出(NDS 0.72 vs. 0.69)を改善し、実際のレースデータでの中間プレトレーニングは、シミュレータのみの適応よりも優れたA2RL(NDS 0.726)への最良の転送を実現する。
軌道予測では、A2RLテストシーケンス(FDE 0.947 vs. 1.250)のドメイン内A2RLトレーニングを超越し、クロスドメイン予測における動き分布カバレッジの役割を強調した。
EagleVisionは、超高速ダイナミクス下での知覚一般化の体系的な研究を可能にする。
データセットとベンチマークはhttps://avlab.io/EagleVisionで公開されている。
関連論文リスト
- CATS-V2V: A Real-World Vehicle-to-Vehicle Cooperative Perception Dataset with Complex Adverse Traffic Scenarios [25.181569981722976]
本稿では,複雑な交通シナリオ下でのV2V協調認識のための,最初の実世界のデータセットであるCATS-V2Vを紹介する。
100クリップのデータセットには、10HzのLiDAR点雲の60Kフレームと、1.26Mのマルチビュー30Hzカメライメージが含まれている。
そこで本研究では,すべての物体が全センサモードで正確に整列されていることを保証し,目標に基づく時間アライメント手法を提案する。
論文 参考訳(メタデータ) (2025-11-14T11:07:04Z) - Detect Anything via Next Point Prediction [51.55967987350882]
Rex-Omniは最先端の物体認識性能を実現する3BスケールのMLLMである。
COCOやLVISのようなベンチマークでは、Rex-Omniは回帰ベースのモデルに匹敵するパフォーマンスを得る。
論文 参考訳(メタデータ) (2025-10-14T17:59:54Z) - Dual-Path Enhancements in Event-Based Eye Tracking: Augmented Robustness and Adaptive Temporal Modeling [0.0]
イベントベースのアイトラッキングは、拡張現実と人間とコンピュータのインタラクションにとって重要な技術となっている。
既存の方法は、突然の眼球運動や環境騒音といった現実的な課題に苦しむ。
まず、時間シフト、空間的フリップ、イベント削除を組み込んだ堅牢なデータ拡張パイプラインにより、モデルのレジリエンスが向上する。
2つ目は、空間的特徴抽出のための効率的なNet-B3バックボーン、文脈時空間モデリングのための双方向GRU、線形時変状態空間モジュールを組み合わせたハイブリッドアーキテクチャであるKnightPupilを提案する。
論文 参考訳(メタデータ) (2025-04-14T07:57:22Z) - EMT: A Visual Multi-Task Benchmark Dataset for Autonomous Driving [8.97091577113286]
Emirates Multi-Taskデータセットは、統一されたフレームワーク内でマルチタスクのベンチマークをサポートするように設計されている。
ダッシュカメラの視界から3万枚以上のフレームと570,000点の注釈付きバウンディングボックスで構成され、約150kmの走行経路をカバーしている。
論文 参考訳(メタデータ) (2025-02-26T16:06:35Z) - VECTOR: Velocity-Enhanced GRU Neural Network for Real-Time 3D UAV Trajectory Prediction [2.1825723033513165]
シーケンスベースニューラルネットワークにおけるGRU(Gated Recurrent Units)を用いた新しいトラジェクトリ予測手法を提案する。
我々は、合成と実世界のUAV軌跡データの両方を使用し、幅広い飛行パターン、速度、機敏性を捉えています。
GRUベースのモデルは、平均二乗誤差(MSE)を2×10-8に抑えながら、最先端のRNNアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2024-10-24T07:16:42Z) - Transfer Learning from Simulated to Real Scenes for Monocular 3D Object Detection [9.708971995966476]
本稿では,これらの課題に対処するための2段階のトレーニング戦略を紹介する。
当社のアプローチでは,大規模合成データセットであるRoadSense3Dのモデルをトレーニングしています。
実世界のデータセットの組み合わせでモデルを微調整し、実用条件への適応性を高める。
論文 参考訳(メタデータ) (2024-08-28T08:44:58Z) - er.autopilot 1.0: The Full Autonomous Stack for Oval Racing at High
Speeds [61.91756903900903]
インディ・オートノラティカル・チャレンジ (IAC) は、オープンホイールのレースカー上で独立して開発されたソフトウェアを使用して、前例のないスピードとヘッド・ツー・ヘッドのシナリオで競う9つの自律レースチームを集めた。
本稿では,チームTII EuroRacing (TII-ER) が使用するソフトウェアアーキテクチャについて述べる。静的障害物を避け,アクティブオーバーテイクを行い,75m/s (270 km/h) 以上の速度に達するために必要なモジュールをすべて網羅する。
総合的な結果と各モジュールのパフォーマンス、および、チームがそれぞれ2番目と3番目を置く楕円軌道上の競技の最初の2つのイベントで学んだ教訓について説明する。
論文 参考訳(メタデータ) (2023-10-27T12:52:34Z) - Semantic Segmentation in Satellite Hyperspectral Imagery by Deep Learning [54.094272065609815]
本稿では1D-Justo-LiuNetという軽量な1D-CNNモデルを提案する。
1D-Justo-LiuNetは、全てのテストモデルの中で最小のモデルサイズ (4,563 パラメータ) を持つ最大精度 (0.93) を達成する。
論文 参考訳(メタデータ) (2023-10-24T21:57:59Z) - Transforming Model Prediction for Tracking [109.08417327309937]
トランスフォーマーは、誘導バイアスの少ないグローバルな関係を捉え、より強力なターゲットモデルの予測を学ぶことができる。
提案したトラッカーをエンドツーエンドにトレーニングし、複数のトラッカーデータセットに関する総合的な実験を行うことで、その性能を検証する。
我々のトラッカーは3つのベンチマークで新しい技術状態を設定し、挑戦的なLaSOTデータセットで68.5%のAUCを達成した。
論文 参考訳(メタデータ) (2022-03-21T17:59:40Z) - Real Time Monocular Vehicle Velocity Estimation using Synthetic Data [78.85123603488664]
移動車に搭載されたカメラから車両の速度を推定する問題を考察する。
そこで本研究では,まずオフ・ザ・シェルフ・トラッカーを用いて車両バウンディングボックスを抽出し,その後,小型ニューラルネットワークを用いて車両速度を回帰する2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-16T13:10:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。