論文の概要: Overlooked Poses Actually Make Sense: Distilling Privileged Knowledge
for Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2208.01302v1
- Date: Tue, 2 Aug 2022 08:13:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:21:52.273733
- Title: Overlooked Poses Actually Make Sense: Distilling Privileged Knowledge
for Human Motion Prediction
- Title(参考訳): 人間の動きの予測に精巧な知識を蒸留する、見過ごされがちな感覚
- Authors: Xiaoning Sun, Qiongjie Cui, Huaijiang Sun, Bin Li, Weiqing Li and
Jianfeng Lu
- Abstract要約: 人間の動作予測に関するこれまでの研究は、観測されたシーケンスと予測されるシーケンスの間のマッピング関係を構築するパターンに従っている。
本稿では,従来見過ごされていた人間のポーズを導入し,予測タスクを実装した新しい予測パターンを提案する。
これらのポーズは予測シーケンスの後に存在し、特権シーケンスを形成する。
- 参考スコア(独自算出の注目度): 26.25110973770013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous works on human motion prediction follow the pattern of building a
mapping relation between the sequence observed and the one to be predicted.
However, due to the inherent complexity of multivariate time series data, it
still remains a challenge to find the extrapolation relation between motion
sequences. In this paper, we present a new prediction pattern, which introduces
previously overlooked human poses, to implement the prediction task from the
view of interpolation. These poses exist after the predicted sequence, and form
the privileged sequence. To be specific, we first propose an InTerPolation
learning Network (ITP-Network) that encodes both the observed sequence and the
privileged sequence to interpolate the in-between predicted sequence, wherein
the embedded Privileged-sequence-Encoder (Priv-Encoder) learns the privileged
knowledge (PK) simultaneously. Then, we propose a Final Prediction Network
(FP-Network) for which the privileged sequence is not observable, but is
equipped with a novel PK-Simulator that distills PK learned from the previous
network. This simulator takes as input the observed sequence, but approximates
the behavior of Priv-Encoder, enabling FP-Network to imitate the interpolation
process. Extensive experimental results demonstrate that our prediction pattern
achieves state-of-the-art performance on benchmarked H3.6M, CMU-Mocap and 3DPW
datasets in both short-term and long-term predictions.
- Abstract(参考訳): 人間の運動予測に関する以前の研究は、観測されるシーケンスと予測対象のシーケンスのマッピング関係を構築するパターンに従っている。
しかしながら、多変量時系列データの固有の複雑さのため、動き列間の外挿関係を見つけることは依然として課題である。
本稿では、補間の観点から予測タスクを実装するために、以前見過ごされた人間のポーズを導入した新しい予測パターンを提案する。
これらのポーズは予測シーケンス後に存在し、特権シーケンスを形成する。
InTerPolation Learning Network (ITP-Network) は、観測されたシーケンスと特権シーケンスの両方を符号化して予測シーケンスを補間し、組み込まれたPrivleged-Sequence-Encoder (Priv-Encoder) が特権知識(PK)を同時に学習する。
次に、特権シーケンスが観測不可能なファイナル予測ネットワーク(FP-Network)を提案するが、従来のネットワークから学習したPKを蒸留する新しいPK-Simulatorを備えている。
このシミュレータは観測されたシーケンスの入力であるが、privエンコーダの挙動を近似し、fp-ネットワークが補間プロセスを模倣することができる。
その結果,H3.6M,CMU-Mocap,および3DPWデータセットの短期的および長期的予測において,予測パターンが最先端の性能を達成することが示された。
関連論文リスト
- Sparse Prototype Network for Explainable Pedestrian Behavior Prediction [60.80524827122901]
Sparse Prototype Network (SPN) は,歩行者の将来の行動,軌道,ポーズを同時に予測するための説明可能な手法である。
モノセマンティリティとクラスタリングの制約によって規則化されたプロトタイプは、一貫性と人間の理解可能な機能を学ぶ。
論文 参考訳(メタデータ) (2024-10-16T03:33:40Z) - AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.94343412438211]
本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文 参考訳(メタデータ) (2024-03-20T06:22:37Z) - DeFeeNet: Consecutive 3D Human Motion Prediction with Deviation Feedback [23.687223152464988]
既存のワンオフ予測モデルに付加可能な,シンプルで効果的なネットワークであるDeFeeNetを提案する。
提案するネットワークは,基本モデルによらず連続的な人間の動作予測性能を向上させる。
論文 参考訳(メタデータ) (2023-04-10T10:18:23Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Pose Transformers (POTR): Human Motion Prediction with
Non-Autoregressive Transformers [24.36592204215444]
本研究では,トランスフォーマーアーキテクチャを非自己回帰型人間の動作予測に活用することを提案する。
我々のアプローチは、以前の予測を条件にするのではなく、クエリシーケンスから並列に要素をデコードする。
その単純さにもかかわらず、我々のアプローチは2つの公開データセットで競合する結果を達成している。
論文 参考訳(メタデータ) (2021-09-15T18:55:15Z) - Aligned Contrastive Predictive Coding [10.521845940927163]
対照的予測損失を用いて訓練された自己監督モデルが、ゆっくりと変化する潜在表現を抽出する可能性を研究する。
将来の表現ごとに個別の予測を生成するのではなく、モデルはそれらが整列する次の表現よりも短い一連の予測を出力する。
論文 参考訳(メタデータ) (2021-04-24T13:07:22Z) - Predicting Temporal Sets with Deep Neural Networks [50.53727580527024]
本稿では,時間集合予測のためのディープニューラルネットワークに基づく統合解を提案する。
ユニークな視点は、セットレベルの共起グラフを構築することで要素関係を学ぶことである。
我々は,要素や集合の時間依存性を適応的に学習するアテンションベースのモジュールを設計する。
論文 参考訳(メタデータ) (2020-06-20T03:29:02Z) - TTPP: Temporal Transformer with Progressive Prediction for Efficient
Action Anticipation [46.28067541184604]
ビデオアクション予測は、観察されたフレームから将来のアクションカテゴリを予測することを目的としている。
現在の最先端のアプローチは主に、履歴情報を隠された状態にエンコードするために、リカレントニューラルネットワークを利用する。
本稿では,プログレッシブ予測フレームワークを用いた簡易かつ効率的な時間変換器を提案する。
論文 参考訳(メタデータ) (2020-03-07T07:59:42Z) - ProphetNet: Predicting Future N-gram for Sequence-to-Sequence
Pre-training [85.35910219651572]
本稿ではProphetNetと呼ばれる新しいシーケンス・ツー・シーケンス事前学習モデルを提案する。
将来的なn-gram予測という,新たな自己教師型目標を導入している。
我々は,CNN/DailyMail,Gigaword,SQuAD 1.1ベンチマークを用いて,抽象的な要約と質問生成タスクの実験を行った。
論文 参考訳(メタデータ) (2020-01-13T05:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。