論文の概要: Graph-Guided MLP-Mixer for Skeleton-Based Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2304.03532v2
- Date: Mon, 7 Aug 2023 07:25:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 23:21:11.171957
- Title: Graph-Guided MLP-Mixer for Skeleton-Based Human Motion Prediction
- Title(参考訳): 人体運動予測のためのグラフガイド型MLPミキサ
- Authors: Xinshun Wang, Qiongjie Cui, Chen Chen, Shen Zhao, Mengyuan Liu
- Abstract要約: グラフ畳み込みネットワーク(GCN)は人間の動作予測に広く利用されているが、その性能は相変わらず不満足である。
Human-Mixerは、GCNに代わる有望な代替手段として、人間の動き予測に活用されている。
グラフガイダンスを取り入れることで、TextitGraph-Guided Mixerは、人間の骨格のグラフ表現内の特定の接続パターンを効果的にキャプチャし、利用することができる。
- 参考スコア(独自算出の注目度): 14.988322340164391
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, Graph Convolutional Networks (GCNs) have been widely used in
human motion prediction, but their performance remains unsatisfactory.
Recently, MLP-Mixer, initially developed for vision tasks, has been leveraged
into human motion prediction as a promising alternative to GCNs, which achieves
both better performance and better efficiency than GCNs. Unlike GCNs, which can
explicitly capture human skeleton's bone-joint structure by representing it as
a graph with edges and nodes, MLP-Mixer relies on fully connected layers and
thus cannot explicitly model such graph-like structure of human's. To break
this limitation of MLP-Mixer's, we propose \textit{Graph-Guided Mixer}, a novel
approach that equips the original MLP-Mixer architecture with the capability to
model graph structure. By incorporating graph guidance, our
\textit{Graph-Guided Mixer} can effectively capture and utilize the specific
connectivity patterns within human skeleton's graph representation. In this
paper, first we uncover a theoretical connection between MLP-Mixer and GCN that
is unexplored in existing research. Building on this theoretical connection,
next we present our proposed \textit{Graph-Guided Mixer}, explaining how the
original MLP-Mixer architecture is reinvented to incorporate guidance from
graph structure. Then we conduct an extensive evaluation on the Human3.6M,
AMASS, and 3DPW datasets, which shows that our method achieves state-of-the-art
performance.
- Abstract(参考訳): 近年,グラフ畳み込みネットワーク(GCN)は人間の動作予測に広く利用されているが,その性能は相変わらず不満足である。
近年、視覚タスク用に開発されたMLP-Mixerは、GCNの代替として人間の動き予測に活用され、GCNよりも優れた性能と効率を達成している。
ヒト骨格の骨結合構造をエッジとノードのグラフとして表すGCNとは異なり、MLP-Mixerは完全な連結層に依存しており、そのようなグラフのような人間の構造を明示的にモデル化することはできない。
MLP-Mixer のこの制限を打破するために,従来の MLP-Mixer アーキテクチャにグラフ構造をモデル化する機能を備えた新しいアプローチである \textit{Graph-Guided Mixer} を提案する。
グラフガイダンスを組み込むことで、人間の骨格のグラフ表現内の特定の接続パターンを効果的にキャプチャし、利用することができる。
本稿では,MLP-Mixer と GCN との理論的関係を明らかにする。
次に提案した『textit{Graph-Guided Mixer} 』を,グラフ構造からのガイダンスを組み込むために,元の MLP-Mixer アーキテクチャを再発明した方法について述べる。
そして,Human3.6M,AMASS,および3DPWデータセットについて広範囲に評価を行い,本手法が最先端の性能を実現することを示す。
関連論文リスト
- Graph Neural Machine: A New Model for Learning with Tabular Data [25.339493426758903]
グラフニューラルネットワーク(GNN)は最近、グラフ上で機械学習タスクを実行するための標準ツールになっている。
本稿では,表現が非同期メッセージパッシングGNNモデルと等価であることを示す。
次に、データのための新しい機械学習モデル、いわゆるグラフニューラルネットワーク(GNM)を提案する。
論文 参考訳(メタデータ) (2024-02-05T10:22:15Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - M3C: A Framework towards Convergent, Flexible, and Unsupervised Learning
of Mixture Graph Matching and Clustering [57.947071423091415]
本稿では,理論収束を保証する学習自由度アルゴリズムであるM3Cを提案する。
我々は、新しいエッジワイド親和性学習と擬似ラベル選択を組み込んだ教師なしモデルUM3Cを開発した。
提案手法は,最先端のグラフマッチングと混合グラフマッチングとクラスタリングの手法を精度と効率の両面で優れている。
論文 参考訳(メタデータ) (2023-10-27T19:40:34Z) - Edge-free but Structure-aware: Prototype-Guided Knowledge Distillation
from GNNs to MLPs [22.541655587228203]
グラフタスク上での低遅延多層パーセプトロン(MLP)への高精度グラフニューラルネットワーク(GNN)の蒸留はホットな研究トピックとなっている。
グラフエッジ(エッジフリー)を必要としないが構造認識を学習するプロトタイプガイド型知識蒸留(PGKD)法を提案する。
論文 参考訳(メタデータ) (2023-03-24T02:28:55Z) - Graph Mixer Networks [0.0]
グラフ構造化データの基盤ミクサーの原理を組み込んだグラフミクサーネットワーク(GNasNets, Graph Nasreddin Nets)を提案する。
複数のアグリゲータを持つPNAモデルを用いて,提案したGMNはグラフ変換器と比較して性能が向上したことを示す。
論文 参考訳(メタデータ) (2023-01-29T17:03:00Z) - A Generalization of ViT/MLP-Mixer to Graphs [32.86160915431453]
我々は、Graph ViT/MLP-Mixerと呼ばれる新しいGNNのクラスを紹介する。
長距離依存を捕捉し、オーバー・スカッシングの問題を緩和する。
ノード数とエッジ数にリニアな複雑さで、スピードとメモリ効率が向上する。
論文 参考訳(メタデータ) (2022-12-27T03:27:46Z) - MLPInit: Embarrassingly Simple GNN Training Acceleration with MLP
Initialization [51.76758674012744]
大きなグラフ上でグラフニューラルネットワーク(GNN)をトレーニングするのは複雑で、非常に時間がかかる。
我々は、PeerInitと呼ばれるGNNトレーニングアクセラレーションに対して、恥ずかしく単純だが非常に効果的な方法を提案する。
論文 参考訳(メタデータ) (2022-09-30T21:33:51Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - GraphMLP: A Graph MLP-Like Architecture for 3D Human Pose Estimation [68.65764751482774]
GraphMLPは3次元ポーズ推定のためのグローバル-ローカル-グラフィック統合アーキテクチャである。
人体のグラフ構造をモデルに組み込んで、3D人間のポーズのドメイン固有の要求を満たす。
複雑な時間力学を単純な方法でモデル化するために拡張することができ、列長の計算コストは無視できる。
論文 参考訳(メタデータ) (2022-06-13T18:59:31Z) - MLP-Mixer: An all-MLP Architecture for Vision [93.16118698071993]
マルチ層パーセプトロン(MLP)を基盤としたアーキテクチャ「Mixer」を発表。
Mixerはイメージ分類ベンチマークで競合スコアを獲得し、事前トレーニングと推論は最先端のモデルに匹敵する。
論文 参考訳(メタデータ) (2021-05-04T16:17:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。