論文の概要: Skeleton-based Action Recognition with Non-linear Dependency Modeling and Hilbert-Schmidt Independence Criterion
- arxiv url: http://arxiv.org/abs/2412.18780v1
- Date: Wed, 25 Dec 2024 05:02:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:29:23.053730
- Title: Skeleton-based Action Recognition with Non-linear Dependency Modeling and Hilbert-Schmidt Independence Criterion
- Title(参考訳): 非線形依存モデルによる骨格に基づく行動認識とヒルベルト・シュミット独立条件
- Authors: Yuheng Yang,
- Abstract要約: 任意の関節間の依存関係を明示的にモデル化する,新しい依存性改善手法を提案する。
また、Hilbert-Schmidt Independence Criterionを利用して、データ次元の影響を受けずにアクションクラスを区別するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.7252027234425334
- License:
- Abstract: Human skeleton-based action recognition has long been an indispensable aspect of artificial intelligence. Current state-of-the-art methods tend to consider only the dependencies between connected skeletal joints, limiting their ability to capture non-linear dependencies between physically distant joints. Moreover, most existing approaches distinguish action classes by estimating the probability density of motion representations, yet the high-dimensional nature of human motions invokes inherent difficulties in accomplishing such measurements. In this paper, we seek to tackle these challenges from two directions: (1) We propose a novel dependency refinement approach that explicitly models dependencies between any pair of joints, effectively transcending the limitations imposed by joint distance. (2) We further propose a framework that utilizes the Hilbert-Schmidt Independence Criterion to differentiate action classes without being affected by data dimensionality, and mathematically derive learning objectives guaranteeing precise recognition. Empirically, our approach sets the state-of-the-art performance on NTU RGB+D, NTU RGB+D 120, and Northwestern-UCLA datasets.
- Abstract(参考訳): 人間の骨格に基づく行動認識は、長い間人工知能にとって必須の側面であった。
現在の最先端の手法では、接続された骨格関節間の依存関係のみを考慮し、物理的に離れた関節間の非線形依存関係を捕捉する能力を制限する傾向にある。
さらに、既存のほとんどのアプローチでは、動作表現の確率密度を推定することでアクションクラスを区別するが、人間の動きの高次元的な性質は、そのような測定を行う上で固有の困難を引き起こす。
本稿では,(1) 関節間の依存関係を明示的にモデル化し, 関節距離による制約を効果的に超越する新たな依存性改善手法を提案する。
さらに,Hilbert-Schmidt Independence Criterionを用いて,データ次元の影響を受けずにアクションクラスを識別するフレームワークを提案し,正確な認識を保証するための数学的学習目標を導出する。
提案手法は,NTU RGB+D,NTU RGB+D 120,北西UCLAデータセット上での最先端性能を実証的に設定する。
関連論文リスト
- GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - Independence Constrained Disentangled Representation Learning from Epistemological Perspective [13.51102815877287]
Disentangled Representation Learningは、データ生成プロセスにおいて意味論的に意味のある潜伏変数を識別するデータエンコーダをトレーニングすることで、ディープラーニングメソッドの説明可能性を向上させることを目的としている。
不整合表現学習の目的については合意が得られない。
本稿では,相互情報制約と独立性制約を統合した非絡み合い表現学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-04T13:00:59Z) - Relation-Oriented: Toward Causal Knowledge-Aligned AGI [24.76814726122543]
リレーショナル指向パラダイムは、因果的知識に整合した人工知能の開発を促進することを目的としている。
手法として,提案したリレーショナルインデックス表現学習(RIRL)を有効性実験により検証した。
論文 参考訳(メタデータ) (2023-07-31T03:32:59Z) - Self-Attention Neural Bag-of-Features [103.70855797025689]
我々は最近導入された2D-Attentionの上に構築し、注意学習方法論を再構築する。
本稿では,関連情報を強調した2次元目視マスクを学習する機能・時間的アテンション機構を提案する。
論文 参考訳(メタデータ) (2022-01-26T17:54:14Z) - Learning Multi-Granular Spatio-Temporal Graph Network for Skeleton-based
Action Recognition [49.163326827954656]
骨格に基づく行動分類のための新しい多言語時空間グラフネットワークを提案する。
2つの枝の枝からなるデュアルヘッドグラフネットワークを開発し、少なくとも2つの時間分解能を抽出する。
3つの大規模データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-08-10T09:25:07Z) - Relational Reasoning Networks [9.262082274025708]
本稿では,深層建築の潜伏空間における推論を行う新しいエンドツーエンドモデルであるニューロ・シンボリック・ネットワーク(R2N)を提案する。
R2Nは、学習と推論を異種問題に統合する神経象徴的なプラットフォームとして純粋に象徴的またはタスクに適用することができる。
論文 参考訳(メタデータ) (2021-06-01T11:02:22Z) - Disentangling Observed Causal Effects from Latent Confounders using
Method of Moments [67.27068846108047]
我々は、軽度の仮定の下で、識別性と学習可能性に関する保証を提供する。
我々は,線形制約付き結合テンソル分解に基づく効率的なアルゴリズムを開発し,スケーラブルで保証可能な解を得る。
論文 参考訳(メタデータ) (2021-01-17T07:48:45Z) - Decoupled Spatial-Temporal Attention Network for Skeleton-Based Action
Recognition [46.836815779215456]
本稿では,骨格に基づく行動認識のための空間的注意ネットワーク(DSTA-Net)を提案する。
注意ブロックの構築には,空間的時間的注意分離,非結合位置符号化,空間的大域正規化という3つの手法が提案されている。
提案手法の有効性を検証するため,骨格に基づくジェスチャーと行動認識のための4つの挑戦的データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2020-07-07T07:58:56Z) - Towards Understanding the Adversarial Vulnerability of Skeleton-based
Action Recognition [133.35968094967626]
骨格に基づく行動認識は、動的状況への強い適応性から注目を集めている。
ディープラーニング技術の助けを借りて、かなり進歩し、現在、良識のある環境で約90%の精度を達成している。
異なる対角的環境下での骨格に基づく行動認識の脆弱性に関する研究はいまだ研究されていない。
論文 参考訳(メタデータ) (2020-05-14T17:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。