論文の概要: Pose Refinement Graph Convolutional Network for Skeleton-based Action
Recognition
- arxiv url: http://arxiv.org/abs/2010.07367v2
- Date: Mon, 18 Jan 2021 16:15:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 13:57:38.973068
- Title: Pose Refinement Graph Convolutional Network for Skeleton-based Action
Recognition
- Title(参考訳): スケルトンベース行動認識のためのポーズ改善グラフ畳み込みネットワーク
- Authors: Shijie Li, Jinhui Yi, Yazan Abu Farha and Juergen Gall
- Abstract要約: 本稿では,行動認識のための高効率なグラフ畳み込みネットワークを提案する。
我々のネットワークはパラメータを86%-93%削減し、浮動小数点演算を89%-96%削減する。
正確性、メモリフットプリント、処理時間のトレードオフをはるかに改善し、ロボティクスアプリケーションに適している。
- 参考スコア(独自算出の注目度): 21.720764076798904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the advances in capturing 2D or 3D skeleton data, skeleton-based action
recognition has received an increasing interest over the last years. As
skeleton data is commonly represented by graphs, graph convolutional networks
have been proposed for this task. While current graph convolutional networks
accurately recognize actions, they are too expensive for robotics applications
where limited computational resources are available. In this paper, we
therefore propose a highly efficient graph convolutional network that addresses
the limitations of previous works. This is achieved by a parallel structure
that gradually fuses motion and spatial information and by reducing the
temporal resolution as early as possible. Furthermore, we explicitly address
the issue that human poses can contain errors. To this end, the network first
refines the poses before they are further processed to recognize the action. We
therefore call the network Pose Refinement Graph Convolutional Network.
Compared to other graph convolutional networks, our network requires 86\%-93\%
less parameters and reduces the floating point operations by 89%-96% while
achieving a comparable accuracy. It therefore provides a much better trade-off
between accuracy, memory footprint and processing time, which makes it suitable
for robotics applications.
- Abstract(参考訳): 2Dまたは3Dの骨格データを取得する進歩により、骨格に基づく行動認識はここ数年で注目されている。
スケルトンデータはグラフによって一般的に表現されるので、グラフ畳み込みネットワークが提案されている。
現在のグラフ畳み込みネットワークはアクションを正確に認識するが、計算資源が限られているロボティクスアプリケーションでは高価すぎる。
そこで本稿では,従来の作業の限界に対処する高効率なグラフ畳み込みネットワークを提案する。
これは、動きと空間情報を徐々に融合し、時間分解能をできるだけ早く低減する並列構造によって達成される。
さらに、人間のポーズがエラーを含むことができる問題に明示的に対処する。
この目的のために、ネットワークはまず、アクションを認識するためにさらに処理される前に、ポーズを洗練する。
したがって、我々はネットワークを Pose Refinement Graph Convolutional Network と呼ぶ。
他のグラフ畳み込みネットワークと比較して、我々のネットワークはパラメータを86\%-93\%少なくし、浮動小数点演算を89%-96%削減し、同等の精度を達成する。
したがって、精度、メモリフットプリント、処理時間の間のトレードオフがより良くなり、ロボティクスアプリケーションに適している。
関連論文リスト
- Multi-Graph Convolution Network for Pose Forecasting [0.8057006406834467]
本稿では,3次元ポーズ予測のための多グラフ畳み込みネットワーク(MGCN)を提案する。
MGCNは、ポーズシーケンスのための拡張グラフを導入することで、空間情報と時間情報を同時にキャプチャする。
評価では,MGCNはポーズ予測において最先端の予測よりも優れていた。
論文 参考訳(メタデータ) (2023-04-11T03:59:43Z) - Pushing the Limits of Asynchronous Graph-based Object Detection with
Event Cameras [62.70541164894224]
低計算を維持しながら、そのようなモデルの深さと複雑さを拡大できるアーキテクチャ選択をいくつか導入する。
我々の手法は、密度の高いグラフニューラルネットワークよりも3.7倍高速に動作し、前方通過はわずか8.4msである。
論文 参考訳(メタデータ) (2022-11-22T15:14:20Z) - MultiScale MeshGraphNets [65.26373813797409]
我々はMeshGraphNetsからフレームワークを改善するための2つの補完的なアプローチを提案する。
まず、より粗いメッシュ上で高解像度システムの正確なサロゲートダイナミクスを学習できることを実証する。
次に、2つの異なる解像度でメッセージを渡す階層的アプローチ(MultiScale MeshGraphNets)を導入する。
論文 参考訳(メタデータ) (2022-10-02T20:16:20Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - ItNet: iterative neural networks with small graphs for accurate and
efficient anytime prediction [1.52292571922932]
本研究では,計算グラフの観点から,メモリフットプリントが小さいネットワークモデルについて紹介する。
CamVidおよびCityscapesデータセットでセマンティックセグメンテーションの最新の結果を示します。
論文 参考訳(メタデータ) (2021-01-21T15:56:29Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Not Half Bad: Exploring Half-Precision in Graph Convolutional Neural
Networks [8.460826851547294]
現代の機械学習を用いた効率的なグラフ解析は、ますます注目を集めている。
ディープラーニングアプローチは、隣接行列全体にわたって運用されることが多い。
実行時間とメモリ要求の両方を削減するための効率的な対策を特定することが望ましい。
論文 参考訳(メタデータ) (2020-10-23T19:47:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。