論文の概要: Valeo4Cast: A Modular Approach to End-to-End Forecasting
- arxiv url: http://arxiv.org/abs/2406.08113v1
- Date: Wed, 12 Jun 2024 11:50:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 17:05:29.592876
- Title: Valeo4Cast: A Modular Approach to End-to-End Forecasting
- Title(参考訳): Valeo4Cast: エンドツーエンドの予測に対するモジュール的アプローチ
- Authors: Yihong Xu, Éloi Zablocki, Alexandre Boulch, Gilles Puy, Mickael Chen, Florent Bartoccioni, Nermin Samet, Oriane Siméoni, Spyros Gidaris, Tuan-Hung Vu, Andrei Bursuc, Eduardo Valle, Renaud Marlet, Matthieu Cord,
- Abstract要約: 検出、追跡、予測モジュールを個別に構築し、トレーニングします。
その後、モジュールをよりよく統合し、複雑なエラーを軽減するために、連続的な微調整ステップのみを使用します。
私たちのソリューションは、CVPR 2024 Workshop on Autonomous Drivingで開催されるArgoverse 2 end-to-end Forecasting Challengeで第1位です。
- 参考スコア(独自算出の注目度): 93.86257326005726
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Motion forecasting is crucial in autonomous driving systems to anticipate the future trajectories of surrounding agents such as pedestrians, vehicles, and traffic signals. In end-to-end forecasting, the model must jointly detect from sensor data (cameras or LiDARs) the position and past trajectories of the different elements of the scene and predict their future location. We depart from the current trend of tackling this task via end-to-end training from perception to forecasting and we use a modular approach instead. Following a recent study, we individually build and train detection, tracking, and forecasting modules. We then only use consecutive finetuning steps to integrate the modules better and alleviate compounding errors. Our study reveals that this simple yet effective approach significantly improves performance on the end-to-end forecasting benchmark. Consequently, our solution ranks first in the Argoverse 2 end-to-end Forecasting Challenge held at CVPR 2024 Workshop on Autonomous Driving (WAD), with 63.82 mAPf. We surpass forecasting results by +17.1 points over last year's winner and by +13.3 points over this year's runner-up. This remarkable performance in forecasting can be explained by our modular paradigm, which integrates finetuning strategies and significantly outperforms the end-to-end-trained counterparts.
- Abstract(参考訳): 運動予測は、歩行者、車両、交通信号などの周辺エージェントの将来の軌道を予測するために、自律運転システムにおいて不可欠である。
エンドツーエンドの予測では、モデルは、シーンの異なる要素の位置と過去の軌跡をセンサーデータ(カメラまたはLiDAR)から共同で検出し、将来の位置を予測する必要がある。
私たちは、知覚から予測までエンドツーエンドのトレーニングを通じて、このタスクに取り組む現在のトレンドから離れ、代わりにモジュラーアプローチを使用します。
最近の研究では、検出、追跡、予測モジュールを個別に構築し、訓練する。
その後、モジュールをよりよく統合し、複雑なエラーを軽減するために、連続的な微調整ステップのみを使用します。
本研究は,この単純かつ効果的な手法により,エンドツーエンド予測ベンチマークの性能が著しく向上することを明らかにする。
その結果, CVPR 2024ワークショップ(WAD)で開催されるArgoverse 2 end-to-end Forecasting Challengeに63.82 mAPfでランクインした。
私たちは、昨年の優勝者より+17.1ポイント、今年の優勝者より+13.3ポイント、予測結果を+17.1ポイント上回る。
予測におけるこの顕著なパフォーマンスは、微調整戦略を統合したモジュールパラダイムによって説明できます。
関連論文リスト
- Multi-Agent Trajectory Prediction with Difficulty-Guided Feature Enhancement Network [1.5888246742280365]
軌道予測は、交通参加者の将来の動きを予測することを目的として、自動運転に不可欠である。
伝統的な方法は通常、エージェントの軌道に関する全体論的推論を行い、エージェント間の難易度の違いを無視する。
本稿では,エージェント間の予測難易度差を利用した,DGFNet(DifficultyGuided Feature Enhancement)を提案する。
論文 参考訳(メタデータ) (2024-07-26T07:04:30Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - Towards Motion Forecasting with Real-World Perception Inputs: Are
End-to-End Approaches Competitive? [93.10694819127608]
実世界の知覚入力を用いた予測手法の統一評価パイプラインを提案する。
我々の詳細な調査では、キュレートされたデータから知覚ベースのデータへ移行する際の大きなパフォーマンスギャップが明らかになりました。
論文 参考訳(メタデータ) (2023-06-15T17:03:14Z) - Forecasting from LiDAR via Future Object Detection [47.11167997187244]
そこで本研究では,センサの生計測に基づく検出と動作予測のためのエンドツーエンドアプローチを提案する。
未来と現在の場所を多対一でリンクすることで、我々のアプローチは複数の未来を推論することができる。
論文 参考訳(メタデータ) (2022-03-30T13:40:28Z) - Transforming Model Prediction for Tracking [109.08417327309937]
トランスフォーマーは、誘導バイアスの少ないグローバルな関係を捉え、より強力なターゲットモデルの予測を学ぶことができる。
提案したトラッカーをエンドツーエンドにトレーニングし、複数のトラッカーデータセットに関する総合的な実験を行うことで、その性能を検証する。
我々のトラッカーは3つのベンチマークで新しい技術状態を設定し、挑戦的なLaSOTデータセットで68.5%のAUCを達成した。
論文 参考訳(メタデータ) (2022-03-21T17:59:40Z) - Sliding Sequential CVAE with Time Variant Socially-aware Rethinking for
Trajectory Prediction [13.105275905781632]
歩行者の軌道予測は、ビデオ監視、社会ロボットナビゲーション、自動運転など、多くのアプリケーションにおいて重要な技術である。
本研究は,CVAEモジュールと社会的に認識された回帰モジュールからなるCSRと呼ばれる新しい軌道予測手法を提案する。
実験の結果,提案手法はスタンフォード・ドローン・データセットの最先端手法よりも改善されていることが示された。
論文 参考訳(メタデータ) (2021-10-28T10:56:21Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z) - PnPNet: End-to-End Perception and Prediction with Tracking in the Loop [82.97006521937101]
我々は、自動運転車の文脈において、共同認識と運動予測の問題に取り組む。
我々は,入力センサデータとしてエンド・ツー・エンドのモデルであるNetを提案し,各ステップのオブジェクト追跡とその将来レベルを出力する。
論文 参考訳(メタデータ) (2020-05-29T17:57:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。