論文の概要: PPT: Pretraining with Pseudo-Labeled Trajectories for Motion Forecasting
- arxiv url: http://arxiv.org/abs/2412.06491v2
- Date: Wed, 30 Apr 2025 18:34:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.17062
- Title: PPT: Pretraining with Pseudo-Labeled Trajectories for Motion Forecasting
- Title(参考訳): PPT:Pseudo-labeled Trajectories を用いた動き予測のための事前学習
- Authors: Yihong Xu, Yuan Yin, Éloi Zablocki, Tuan-Hung Vu, Alexandre Boulch, Matthieu Cord,
- Abstract要約: 最先端のモーション予測モデルは、手動で注釈を付けたり、非常に後処理されたトラジェクトリを備えた、大規模なキュレートされたデータセットに依存している。
PWTはシンプルでスケーラブルな代替手段で、市販の3D検出器とトラッキングから自動生成される、未処理で多様な軌道を使用する。
標準ベンチマーク、特に低データのレシエーション、クロスドメイン、エンドツーエンド、マルチクラスの設定において、強力なパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 90.47748423913369
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately predicting how agents move in dynamic scenes is essential for safe autonomous driving. State-of-the-art motion forecasting models rely on large curated datasets with manually annotated or heavily post-processed trajectories. However, building these datasets is costly, generally manual, hard to scale, and lacks reproducibility. They also introduce domain gaps that limit generalization across environments. We introduce PPT (Pretraining with Pseudo-labeled Trajectories), a simple and scalable alternative that uses unprocessed and diverse trajectories automatically generated from off-the-shelf 3D detectors and tracking. Unlike traditional pipelines aiming for clean, single-label annotations, PPT embraces noise and diversity as useful signals for learning robust representations. With optional finetuning on a small amount of labeled data, models pretrained with PPT achieve strong performance across standard benchmarks particularly in low-data regimes, and in cross-domain, end-to-end and multi-class settings. PPT is easy to implement and improves generalization in motion forecasting. Code and data will be released upon acceptance.
- Abstract(参考訳): エージェントがダイナミックなシーンでどのように動くかを正確に予測することは、安全な自動運転に不可欠である。
最先端のモーション予測モデルは、手動で注釈を付けたり、非常に後処理されたトラジェクトリを備えた、大規模なキュレートされたデータセットに依存している。
しかしながら、これらのデータセットの構築はコストがかかり、一般的に手作業で、スケールが難しく、再現性に欠ける。
また、環境間の一般化を制限するドメインギャップも導入している。
PPT(Pretraining with Pseudo-labeled Trajectories)は,市販の3D検出器とトラッキングから自動生成される,未処理で多様なトラジェクトリを利用する,シンプルでスケーラブルな代替手段である。
クリーンでシングルラベルのアノテーションを目的とした従来のパイプラインとは異なり、PPTは堅牢な表現を学ぶための有用な信号としてノイズと多様性を取り入れている。
少量のラベル付きデータを任意に微調整することで、PPTで事前訓練されたモデルは、特に低データレシエーションやクロスドメイン、エンドツーエンド、マルチクラス設定において、標準ベンチマークで強いパフォーマンスを達成する。
PPTは実装が容易で、動き予測の一般化を改善する。
コードとデータは受理時にリリースされる。
関連論文リスト
- Finetuning Pre-trained Model with Limited Data for LiDAR-based 3D Object Detection by Bridging Domain Gaps [8.897884780881535]
LiDARベースの3Dオブジェクト検出器は、センサーの設定が異なるターゲットドメインにうまく適応できないことが多い。
近年の研究では、トレーニング済みのバックボーンは大規模でラベルのないLiDARフレームで自己管理的に学習できることが示唆されている。
本研究では,対象データに制限のある事前学習モデルを適用するために,DADT(Domain Adaptive Distill-Tuning)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T08:22:42Z) - TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Forecast-PEFT: Parameter-Efficient Fine-Tuning for Pre-trained Motion Forecasting Models [68.23649978697027]
Forecast-PEFTは、モデルのパラメータの大部分を凍結し、新しく導入されたプロンプトとアダプタの調整に集中する微調整戦略である。
実験の結果,Forecast-PEFTは動作予測タスクにおいて従来のフルチューニング手法よりも優れていた。
Forecast-FTは予測性能をさらに改善し、従来のベースライン法よりも最大9.6%向上した。
論文 参考訳(メタデータ) (2024-07-28T19:18:59Z) - DPTraj-PM: Differentially Private Trajectory Synthesis Using Prefix Tree and Markov Process [1.800676987432211]
DPTraj-PMは,差分プライバシーの枠組みの下でトラジェクトリデータセットを合成する手法である。
DPTraj-PMは、生の軌跡を隣接する細胞に識別し、プレフィックスツリー構造とm次マルコフ過程を組み合わせてモデル化する。
DPTraj-PMが作成した出力トレースは、個人の移動行動のパターンと変動性を保持するだけでなく、個人のプライバシーも保護している。
論文 参考訳(メタデータ) (2024-04-22T11:52:11Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - SPOT: Scalable 3D Pre-training via Occupancy Prediction for Learning Transferable 3D Representations [76.45009891152178]
トレーニング-ファインタニングアプローチは、さまざまな下流データセットとタスクをまたいだトレーニング済みのバックボーンを微調整することで、ラベル付けの負担を軽減することができる。
本稿では, 一般表現学習が, 占領予測のタスクを通じて達成できることを, 初めて示す。
本研究は,LiDAR 点の理解を促進するとともに,LiDAR の事前訓練における今後の進歩の道を開くことを目的とする。
論文 参考訳(メタデータ) (2023-09-19T11:13:01Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - Efficient Baselines for Motion Prediction in Autonomous Driving [7.608073471097835]
複数の周辺エージェントの運動予測(MP)は、任意に複雑な環境において重要な課題である。
注意機構やGNNを含むMPのためのSOTA(State-Of-The-Art)技術を用いて,コンパクトなモデルを開発することを目指している。
論文 参考訳(メタデータ) (2023-09-06T22:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。