Fugu-MT 論文翻訳(概要): Towards Consistent Stochastic Human Motion Prediction via Motion Diffusion

論文の概要: Towards Consistent Stochastic Human Motion Prediction via Motion Diffusion

arxiv url: http://arxiv.org/abs/2305.12554v2
Date: Tue, 19 Dec 2023 23:52:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-21 19:27:31.505217
Title: Towards Consistent Stochastic Human Motion Prediction via Motion Diffusion
Title（参考訳）: 動き拡散による連続確率的人間の動き予測に向けて
Authors: Jiarui Sun, Girish Chowdhary
Abstract要約: そこで我々は,DiffMotionをエンドツーエンドの拡散に基づくHuman Motion Predictionフレームワークとして提案する。ベンチマーク分析の結果,DiffMotionは精度と忠実度の両方で従来の手法よりも有意に優れていた。
参考スコア（独自算出の注目度）: 8.10696589962658
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Stochastic Human Motion Prediction (HMP) aims to predict multiple possible upcoming pose sequences based on past human motion trajectories. Although previous approaches have shown impressive performance, they face several issues, including complex training processes and a tendency to generate predictions that are often inconsistent with the provided history, and sometimes even becoming entirely unreasonable. To overcome these issues, we propose DiffMotion, an end-to-end diffusion-based stochastic HMP framework. DiffMotion's motion predictor is composed of two modules, including (1) a Transformer-based network for initial motion reconstruction from corrupted motion, and (2) a Graph Convolutional Network (GCN) to refine the generated motion considering past observations. Our method, facilitated by this novel Transformer-GCN module design and a proposed variance scheduler, excels in predicting accurate, realistic, and consistent motions, while maintaining an appropriate level of diversity. Our results on benchmark datasets show that DiffMotion significantly outperforms previous methods in terms of both accuracy and fidelity, while demonstrating superior robustness.
Abstract（参考訳）: Stochastic Human Motion Prediction (HMP) は、過去の人間の運動軌跡に基づいて、複数の可能性のあるポーズシーケンスを予測することを目的としている。以前のアプローチは印象的なパフォーマンスを示しているが、複雑なトレーニングプロセスや、提供された履歴と矛盾することが多い予測を生成する傾向など、いくつかの問題に直面している。これらの課題を克服するために、DiffMotionという、エンドツーエンドの拡散に基づく確率的HMPフレームワークを提案する。 DiffMotionの動作予測器は,(1)劣化した動きから初期動作を復元するTransformerベースのネットワーク,(2)過去の観測を考慮し生成した動きを洗練させるGraph Convolutional Network(GCN)の2つのモジュールから構成される。本手法はトランスフォーマー-GCNモジュールの設計と分散スケジューラによって促進され,精度,現実性,一貫した動作の予測に優れ,多様性の適切なレベルを維持している。ベンチマーク分析の結果,DiffMotionは精度と忠実度の両方で従来の手法よりも優れ,強靭性も優れていた。

関連論文リスト

VFMF: World Modeling by Forecasting Vision Foundation Model Features [67.09340259579761]
本稿では,視覚基礎モデルの特徴空間における自己回帰フローマッチングを行う生成予測器を提案する。この潜伏情報の方がPCAベースの代替案よりも効果的であることを示す。一致したアーキテクチャと計算により、本手法はすべてのモダリティにおける回帰よりもシャープで正確な予測を生成する。
論文参考訳（メタデータ） (2025-12-12T02:10:05Z)
Overcoming Semantic Dilution in Transformer-Based Next Frame Prediction [0.9776703963093367]
ビデオにおける次のフレーム予測は、自律運転、オブジェクトトラッキング、モーション予測といったアプリケーションにとって不可欠である。トランスフォーマーベースの次世代の予測モデルは、注目すべき問題に直面している。本稿では,意味的希釈を効果的に緩和するセマンティック集中型マルチヘッド自己認識アーキテクチャを提案する。
論文参考訳（メタデータ） (2025-01-28T07:12:29Z)
Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文参考訳（メタデータ） (2024-07-18T15:44:23Z)
AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.94343412438211]
本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文参考訳（メタデータ） (2024-03-20T06:22:37Z)
TransFusion: A Practical and Effective Transformer-based Diffusion Model for 3D Human Motion Prediction [1.8923948104852863]
本研究では,3次元動作予測のための革新的で実用的な拡散モデルであるTransFusionを提案する。我々のモデルは、浅い層と深い層の間の長いスキップ接続を持つバックボーンとしてTransformerを活用している。クロスアテンションや適応層正規化のような余分なモジュールを利用する従来の拡散モデルとは対照的に、条件を含む全ての入力をトークンとして扱い、より軽量なモデルを作成する。
論文参考訳（メタデータ） (2023-07-30T01:52:07Z)
Uncovering the Missing Pattern: Unified Framework Towards Trajectory Imputation and Prediction [60.60223171143206]
軌道予測は、観測されたシーケンスから実体運動や人間の行動を理解する上で重要な作業である。現在の方法では、観測されたシーケンスが完了したと仮定し、欠落した値の可能性を無視する。本稿では,グラフに基づく条件変動リカレントニューラルネットワーク (GC-VRNN) の統一フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-28T14:27:27Z)
An Energy-Based Prior for Generative Saliency [62.79775297611203]
本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成正当性予測フレームワークを提案する。生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
論文参考訳（メタデータ） (2022-04-19T10:51:00Z)
Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文参考訳（メタデータ） (2022-03-25T16:59:08Z)
Learning to Predict Diverse Human Motions from a Single Image via Mixture Density Networks [9.06677862854201]
本研究では,混合密度ネットワーク(MDN)モデルを用いて,単一画像から将来の人間の動きを予測する新しい手法を提案する。 MDNのマルチモーダルな性質は、既存のディープヒューマンモーション予測アプローチとは対照的に、様々な将来のモーション仮説の生成を可能にしている。訓練されたモデルでは、入力として画像を直接取り、与えられた条件を満たす複数の可視運動を生成する。
論文参考訳（メタデータ） (2021-09-13T08:49:33Z)
Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文参考訳（メタデータ） (2021-08-19T00:58:00Z)
Multitask Non-Autoregressive Model for Human Motion Prediction [33.98939145212708]
非auToregressive Model (NAT) は、文脈エンコーダと位置エンコードモジュールと同様に、完全な非自己回帰復号方式で提案される。提案手法はHuman3.6MとCMU-Mocapのベンチマークで評価され,最先端の自己回帰手法よりも優れている。
論文参考訳（メタデータ） (2020-07-13T15:00:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。