論文の概要: RMP: A Random Mask Pretrain Framework for Motion Prediction
- arxiv url: http://arxiv.org/abs/2309.08989v1
- Date: Sat, 16 Sep 2023 13:09:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 18:04:25.422983
- Title: RMP: A Random Mask Pretrain Framework for Motion Prediction
- Title(参考訳): RMP: 動き予測のためのランダムマスク事前トレーニングフレームワーク
- Authors: Yi Yang, Qingwen Zhang, Thomas Gilles, Nazre Batool, John Folkesson
- Abstract要約: 本稿では,交通参加者の軌道予測のための事前学習タスクを形式化する枠組みを提案する。
提案する事前学習フレームワークはノイズの多い入力を処理でき、動作予測精度とミス率を改善する。
- 参考スコア(独自算出の注目度): 19.365368563777206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As the pretraining technique is growing in popularity, little work has been
done on pretrained learning-based motion prediction methods in autonomous
driving. In this paper, we propose a framework to formalize the pretraining
task for trajectory prediction of traffic participants. Within our framework,
inspired by the random masked model in natural language processing (NLP) and
computer vision (CV), objects' positions at random timesteps are masked and
then filled in by the learned neural network (NN). By changing the mask
profile, our framework can easily switch among a range of motion-related tasks.
We show that our proposed pretraining framework is able to deal with noisy
inputs and improves the motion prediction accuracy and miss rate, especially
for objects occluded over time by evaluating it on Argoverse and NuScenes
datasets.
- Abstract(参考訳): プリトレーニング技術が普及するにつれて、自動運転における事前学習に基づく動き予測手法の研究はほとんど行われていない。
本稿では,交通参加者の軌道予測のための事前学習タスクを形式化する枠組みを提案する。
自然言語処理(NLP)とコンピュータビジョン(CV)のランダムマスクモデルにインスパイアされたフレームワーク内では、ランダムな時間ステップにおけるオブジェクトの位置がマスクされ、学習されたニューラルネットワーク(NN)によって埋められる。
マスクプロファイルを変更することで、我々のフレームワークは様々なモーション関連のタスクに簡単に切り替えることができる。
提案手法は,argoverse と nuscenes のデータセット上で評価することで,ノイズの多い入力に対処でき,特に時間経過に伴う物体の動作予測精度とミス率の向上が期待できることを示す。
関連論文リスト
- Forecast-MAE: Self-supervised Pre-training for Motion Forecasting with
Masked Autoencoders [7.133110402648305]
本研究では,自己教師型学習の動作予測への応用について検討する。
Forecast-MAEは、モーション予測タスクの自己教師型学習用に特別に設計されたマスクオートエンコーダフレームワークの拡張である。
論文 参考訳(メタデータ) (2023-08-19T02:27:51Z) - Difference-Masking: Choosing What to Mask in Continued Pretraining [56.76782116221438]
本研究では,事前訓練中のマスクを自動的に選択するマスキング戦略である差分マスキングを導入する。
差分マスキングは、4つの言語のみ、マルチモーダルなビデオタスクにおいて、継続した事前学習設定のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-23T23:31:02Z) - HumanMAC: Masked Motion Completion for Human Motion Prediction [62.279925754717674]
人間の動き予測はコンピュータビジョンとコンピュータグラフィックスの古典的な問題である。
従来の効果はエンコーディング・デコード方式に基づく経験的性能を実現している。
本稿では,新しい視点から新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-07T18:34:59Z) - Masked Autoencoding for Scalable and Generalizable Decision Making [93.84855114717062]
MaskDPは、強化学習と行動クローンのためのシンプルでスケーラブルな自己教師付き事前学習手法である。
我々は,MaskDPモデルにより,単一ゴールや複数ゴール到達といった新しいBCタスクへのゼロショット転送能力が得られることを発見した。
論文 参考訳(メタデータ) (2022-11-23T07:04:41Z) - PREF: Predictability Regularized Neural Motion Fields [68.60019434498703]
ダイナミックなシーンで3Dの動きを知ることは、多くの視覚応用にとって不可欠である。
多視点設定における全ての点の運動を推定するために神経運動場を利用する。
予測可能な動きを正規化することを提案する。
論文 参考訳(メタデータ) (2022-09-21T22:32:37Z) - Reinforcement Learning with Action-Free Pre-Training from Videos [95.25074614579646]
本稿では,ビデオにおける生成前学習を通じて動的理解に役立つ表現を学習するフレームワークを提案する。
我々のフレームワークは、視覚に基づく強化学習の最終性能とサンプル効率の両方を著しく改善する。
論文 参考訳(メタデータ) (2022-03-25T19:44:09Z) - Train No Evil: Selective Masking for Task-Guided Pre-Training [97.03615486457065]
一般的な事前学習と微調整の間を選択的にマスキングするタスク誘導事前学習段階を付加した3段階のフレームワークを提案する。
提案手法は,50%未満のコストで同等あるいはさらに優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-04-21T03:14:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。