論文の概要: Data-efficient Trajectory Prediction via Coreset Selection
- arxiv url: http://arxiv.org/abs/2409.17385v1
- Date: Wed, 25 Sep 2024 22:00:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-29 00:01:07.999247
- Title: Data-efficient Trajectory Prediction via Coreset Selection
- Title(参考訳): コアセット選択によるデータ効率のトラジェクトリ予測
- Authors: Ruining Yang and Lili Su
- Abstract要約: 軌道予測モデルの訓練には2つの方法がある。
簡単ミーム駆動のシナリオがデータセットを圧倒的に支配することが多い。
コアセット選択に基づく新しいデータ効率訓練手法を提案する。
- 参考スコア(独自算出の注目度): 4.682090083225856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern vehicles are equipped with multiple information-collection devices
such as sensors and cameras, continuously generating a large volume of raw
data. Accurately predicting the trajectories of neighboring vehicles is a vital
component in understanding the complex driving environment. Yet, training
trajectory prediction models is challenging in two ways. Processing the
large-scale data is computation-intensive. Moreover, easy-medium driving
scenarios often overwhelmingly dominate the dataset, leaving challenging
driving scenarios such as dense traffic under-represented. For example, in the
Argoverse motion prediction dataset, there are very few instances with $\ge 50$
agents, while scenarios with $10 \thicksim 20$ agents are far more common. In
this paper, to mitigate data redundancy in the over-represented driving
scenarios and to reduce the bias rooted in the data scarcity of complex ones,
we propose a novel data-efficient training method based on coreset selection.
This method strategically selects a small but representative subset of data
while balancing the proportions of different scenario difficulties. To the best
of our knowledge, we are the first to introduce a method capable of effectively
condensing large-scale trajectory dataset, while achieving a state-of-the-art
compression ratio. Notably, even when using only 50% of the Argoverse dataset,
the model can be trained with little to no decline in performance. Moreover,
the selected coreset maintains excellent generalization ability.
- Abstract(参考訳): 現代の車両はセンサーやカメラなどの複数の情報収集装置を備えており、大量の生データを継続的に生成している。
隣接する車両の軌道を正確に予測することは、複雑な運転環境を理解する上で重要な要素である。
しかし、軌道予測モデルの訓練には2つの方法がある。
大規模データの処理は計算集約的だ。
さらに、簡単なミーム駆動のシナリオがデータセットを圧倒的に支配し、密度の高いトラフィックを表現できないような困難な運転シナリオを残します。
例えば、Argoverseのモーション予測データセットでは、$\ge 50$エージェントを持つインスタンスはほとんどないが、$10 \thicksim 20$エージェントを持つシナリオの方がはるかに一般的である。
本稿では,過度に表現された運転シナリオにおけるデータの冗長性を緩和し,複雑な運転シナリオのデータ不足に根ざしたバイアスを軽減するために,コアセット選択に基づく新しいデータ効率トレーニング手法を提案する。
この方法は、異なるシナリオの難易度の比率をバランスしながら、小さなが代表的なデータのサブセットを戦略的に選択する。
我々の知る限り、我々は、最先端圧縮比を達成しつつ、大規模軌跡データセットを効果的に凝縮できる手法を最初に導入した。
特に、Argoverseデータセットの50%しか使用していない場合でも、モデルをほとんど、あるいはまったくパフォーマンスを低下させることなくトレーニングすることができる。
さらに、選択されたコアセットは優れた一般化能力を維持している。
関連論文リスト
- A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.46695086779598]
実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T03:00:58Z) - TrACT: A Training Dynamics Aware Contrastive Learning Framework for Long-tail Trajectory Prediction [7.3292387742640415]
本稿では,よりリッチなトレーニングダイナミックス情報を,原型的コントラスト学習フレームワークに組み込むことを提案する。
我々は,2つの大規模自然主義データセットを用いたアプローチの実証評価を行った。
論文 参考訳(メタデータ) (2024-04-18T23:12:46Z) - Distil the informative essence of loop detector data set: Is
network-level traffic forecasting hungry for more data? [0.8002196839441036]
本稿では,予測モデルのトレーニングに実際に有効なループデータのサンプル数を検討するために,不確実性を考慮したトラフィック予測フレームワークを提案する。
提案手法は,大規模トラフィックデータセットの真の情報内容を評価する上で有用である。
論文 参考訳(メタデータ) (2023-10-31T11:23:10Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - Large Scale Autonomous Driving Scenarios Clustering with Self-supervised
Feature Extraction [6.804209932400134]
本稿では,自動車運転データの大規模集合に対する包括的データクラスタリングフレームワークを提案する。
提案手法では,トラヒック内エージェントオブジェクトとマップ情報の両方を含むトラフィック要素を網羅的に検討する。
新たに設計されたデータクラスタリング評価メトリクスは、データ拡張に基づくものであるため、精度評価には人間のラベル付きデータセットは必要ない。
論文 参考訳(メタデータ) (2021-03-30T06:22:40Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。