論文の概要: KShapeNet: Riemannian network on Kendall shape space for Skeleton based
Action Recognition
- arxiv url: http://arxiv.org/abs/2011.12004v1
- Date: Tue, 24 Nov 2020 10:14:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 13:27:40.893933
- Title: KShapeNet: Riemannian network on Kendall shape space for Skeleton based
Action Recognition
- Title(参考訳): kshapenet: ケンドール形状空間上のリーマンネットワークによるスケルトンに基づく動作認識
- Authors: Racha Friji, Hassen Drira, Faten Chaieb, Sebastian Kurtek, Hamza Kchok
- Abstract要約: 骨格に基づく行動認識のための幾何学的深層学習手法を提案する。
骨格はまずケンドールの形状空間上の軌跡としてモデル化され、次に線型接空間に写像される。
結果として得られた構造化データは、剛性および非剛性変換を最適化するレイヤを含むディープラーニングアーキテクチャに供給される。
- 参考スコア(独自算出の注目度): 7.183483982542308
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Learning architectures, albeit successful in most computer vision tasks,
were designed for data with an underlying Euclidean structure, which is not
usually fulfilled since pre-processed data may lie on a non-linear space. In
this paper, we propose a geometry aware deep learning approach for
skeleton-based action recognition. Skeleton sequences are first modeled as
trajectories on Kendall's shape space and then mapped to the linear tangent
space. The resulting structured data are then fed to a deep learning
architecture, which includes a layer that optimizes over rigid and non rigid
transformations of the 3D skeletons, followed by a CNN-LSTM network. The
assessment on two large scale skeleton datasets, namely NTU-RGB+D and NTU-RGB+D
120, has proven that proposed approach outperforms existing geometric deep
learning methods and is competitive with respect to recently published
approaches.
- Abstract(参考訳): ディープラーニングアーキテクチャは、ほとんどのコンピュータビジョンタスクで成功したが、基礎となるユークリッド構造を持つデータのために設計された。
本稿では,骨格に基づく行動認識のための幾何学的深層学習手法を提案する。
スケルトン列はまずケンドールの形状空間上の軌道としてモデル化され、次に線型接空間に写像される。
結果として得られた構造化データは、CNN-LSTMネットワークに続いて、3D骨格の剛性および非剛性変換を最適化する層を含むディープラーニングアーキテクチャに供給される。
NTU-RGB+D と NTU-RGB+D 120 の2つの大規模スケルトンデータセットに対する評価は、提案手法が既存の幾何学的深層学習法より優れており、最近発表されたアプローチと競合することを示した。
関連論文リスト
- SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence
Pre-training [110.55093254677638]
我々はSkeleton Sequence Learning(SSL)という,効率的なスケルトンシーケンス学習フレームワークを提案する。
本論文では,SkeletonMAEという非対称なグラフベースのエンコーダデコーダ事前学習アーキテクチャを構築する。
我々のSSLは、さまざまなデータセットにまたがってうまく一般化し、最先端の自己教師型スケルトンベースのアクション認識手法よりも優れています。
論文 参考訳(メタデータ) (2023-07-17T13:33:11Z) - Exploring Data Geometry for Continual Learning [64.4358878435983]
非定常データストリームのデータ幾何を探索することにより,新しい視点から連続学習を研究する。
提案手法は,新しいデータによって引き起こされる幾何構造に対応するために,基底空間の幾何学を動的に拡張する。
実験により,本手法はユークリッド空間で設計したベースライン法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2023-04-08T06:35:25Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Depth Completion using Geometry-Aware Embedding [22.333381291860498]
本稿では,幾何認識の埋め込みを効率的に学習する手法を提案する。
局所的および大域的な幾何学的構造情報を、例えば、シーンレイアウト、オブジェクトのサイズと形状などの3Dポイントから符号化し、深度推定を導く。
論文 参考訳(メタデータ) (2022-03-21T12:06:27Z) - SkeletonNet: A Topology-Preserving Solution for Learning Mesh
Reconstruction of Object Surfaces from RGB Images [85.66560542483286]
本稿では,RGB画像から3次元物体表面再構成を学習する上での課題に焦点を当てる。
我々は,SkeGCNNとSkeDISNの2つのモデルを提案する。
提案するSkeletonNetの有効性を検証するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2020-08-13T07:59:25Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z) - Data-driven effective model shows a liquid-like deep learning [2.0711789781518752]
バイナリシナプスの深いネットワークの状況は、まだ分かっていない。
本稿では,高次元重み空間の最小構造モデルを直接構築することにより,統計力学の枠組みを提案する。
我々のデータ駆動モデルは、高次元の重み空間においてディープラーニングが不合理に有効である理由に関する統計力学的な知見を提供する。
論文 参考訳(メタデータ) (2020-07-16T04:02:48Z) - Deep Manifold Prior [37.725563645899584]
本稿では,3次元形状の表面などの多様体構造データに先行する手法を提案する。
この方法で生成された曲面は滑らかであり、ガウス過程を特徴とする制限的な挙動を示し、完全連結および畳み込みネットワークに対して数学的にそのような特性を導出する。
論文 参考訳(メタデータ) (2020-04-08T20:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。