論文の概要: MMCM: Multimodality-aware Metric using Clustering-based Modes for Probabilistic Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2511.15179v1
- Date: Wed, 19 Nov 2025 07:05:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.673445
- Title: MMCM: Multimodality-aware Metric using Clustering-based Modes for Probabilistic Human Motion Prediction
- Title(参考訳): MMCM:クラスタリングモードを用いたマルチモーダリティ対応メトリックによる確率的人間の動作予測
- Authors: Kyotaro Tokoro, Hiromu Taketsugu, Norimichi Ukita,
- Abstract要約: 本稿では,HMP(Human Motion Prediction)のための新しい指標を提案する。
1つの過去のシーケンスが複数の将来をもたらす可能性があるため、確率論的HMP法はそのような複数の動きを予測する。
- 参考スコア(独自算出の注目度): 14.630705562995885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel metric for Human Motion Prediction (HMP). Since a single past sequence can lead to multiple possible futures, a probabilistic HMP method predicts such multiple motions. While a single motion predicted by a deterministic method is evaluated only with the difference from its ground truth motion, multiple predicted motions should also be evaluated based on their distribution. For this evaluation, this paper focuses on the following two criteria. \textbf{(a) Coverage}: motions should be distributed among multiple motion modes to cover diverse possibilities. \textbf{(b) Validity}: motions should be kinematically valid as future motions observable from a given past motion. However, existing metrics simply appreciate widely distributed motions even if these motions are observed in a single mode and kinematically invalid. To resolve these disadvantages, this paper proposes a Multimodality-aware Metric using Clustering-based Modes (MMCM). For (a) coverage, MMCM divides a motion space into several clusters, each of which is regarded as a mode. These modes are used to explicitly evaluate whether predicted motions are distributed among multiple modes. For (b) validity, MMCM identifies valid modes by collecting possible future motions from a motion dataset. Our experiments validate that our clustering yields sensible mode definitions and that MMCM accurately scores multimodal predictions. Code: https://github.com/placerkyo/MMCM
- Abstract(参考訳): 本稿では,HMP(Human Motion Prediction)の新たな指標を提案する。
単一の過去のシーケンスが複数の将来をもたらす可能性があるため、確率論的HMP法はそのような複数の動きを予測する。
決定論的手法によって予測される1つの動きは、その基底の真理運動との違いでのみ評価されるが、その分布に基づいて複数の予測される動きも評価されるべきである。
本評価では,以下の2つの基準に焦点をあてる。
\textbf{
(a)対象:様々な可能性をカバーするため、複数の動作モードに移動を分散すべきである。
\textbf{
b) 妥当性: 運動は、ある過去の運動から観測可能な将来の運動として運動的に有効であるべきである。
しかし、既存のメトリクスは、単一のモードで観測され、運動が無効である場合でも、広く分散された動きを単純に評価する。
これらの欠点を解決するために,クラスタリングモード(MMCM)を用いたマルチモダリティ対応メトリックを提案する。
対訳 対訳 対訳 対訳 対訳 対訳 対
(a) MMCMは、運動空間を複数のクラスタに分割し、それぞれをモードと見なす。
これらのモードは、予測された動きが複数のモードに分散されているかどうかを明示的に評価するために使用される。
対訳 対訳 対訳 対訳 対訳 対訳 対
b) MMCMは,動作データセットから将来の動きを収集することにより,有効モードを識別する。
実験により,クラスタリングが意味のあるモード定義となり,MMCMが精度良くマルチモーダル予測を行うことを確認した。
コード:https://github.com/placerkyo/MMCM
関連論文リスト
- MotionMap: Representing Multimodality in Human Pose Forecasting [98.26350593416674]
タスクを適切に配置するための代替パラダイムを提案する。
最先端の手法はマルチモーダリティを予測するが、これは大量の予測をオーバーサンプリングする必要がある。
マルチモーダリティのためのシンプルなヒートマップベースの表現であるMotionMapを用いて,これらの問題に対処する。
論文 参考訳(メタデータ) (2024-12-25T11:47:26Z) - MotionDiffuser: Controllable Multi-Agent Motion Prediction using
Diffusion [15.146808801331774]
MotionDiffuserは、複数のエージェント上での将来の軌跡の連成分布の拡散に基づく表現である。
そこで本稿では,コスト関数の相違に基づくトラジェクトリサンプリングを可能にする汎用的な制約付きサンプリングフレームワークを提案する。
我々は,Open Motionデータセット上でのマルチエージェント動作予測の最先端結果を得る。
論文 参考訳(メタデータ) (2023-06-05T17:55:52Z) - BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction [26.306489700180627]
本研究では,人間の動作予測(HMP)における潜伏拡散モデルを利用して,行動がポーズや動きから切り離されている潜伏空間からサンプルを採取するモデルであるBeLFusionを提案する。
サンプルの動作を進行中の動作に転送する能力のおかげで、Belfusion氏の予測は、芸術の状況よりもはるかに現実的なさまざまな行動を示す。
論文 参考訳(メタデータ) (2022-11-25T18:59:03Z) - Weakly-supervised Action Transition Learning for Stochastic Human Motion
Prediction [81.94175022575966]
動作駆動型人間の動作予測の課題について紹介する。
一連の動作ラベルと短い動作履歴から、複数の可算な将来の動作を予測することを目的としている。
論文 参考訳(メタデータ) (2022-05-31T08:38:07Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。
標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2021-08-19T00:58:00Z) - Motion Prediction Using Temporal Inception Module [96.76721173517895]
人間の動作を符号化するTIM(Temporal Inception Module)を提案する。
本フレームワークは,異なる入力長に対して異なるカーネルサイズを用いて,畳み込み層を用いて入力埋め込みを生成する。
標準的な動き予測ベンチマークデータセットであるHuman3.6MとCMUのモーションキャプチャデータセットの実験結果から,我々の手法は一貫して技術手法の状態を上回ります。
論文 参考訳(メタデータ) (2020-10-06T20:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。