論文の概要: Condition-Adaptive Graph Convolution Learning for Skeleton-Based Gait
Recognition
- arxiv url: http://arxiv.org/abs/2308.06707v1
- Date: Sun, 13 Aug 2023 07:51:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 15:56:15.920012
- Title: Condition-Adaptive Graph Convolution Learning for Skeleton-Based Gait
Recognition
- Title(参考訳): 骨格に基づく歩行認識のための条件適応型グラフ畳み込み学習
- Authors: Xiaohu Huang, Xinggang Wang, Zhidianqiu Jin, Bo Yang, Botao He, Bin
Feng, and Wenyu Liu
- Abstract要約: グラフ畳み込みネットワークは骨格に基づく歩行認識に広く応用されている。
この課題の鍵となる課題は、様々な視点で異なる被験者の個々の歩行スタイルを区別することである。
本研究では,各骨格配列の特定の属性に動的に適応できる条件適応型グラフ畳み込みネットワークを提案する。
- 参考スコア(独自算出の注目度): 35.206965037805816
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph convolutional networks have been widely applied in skeleton-based gait
recognition. A key challenge in this task is to distinguish the individual
walking styles of different subjects across various views. Existing
state-of-the-art methods employ uniform convolutions to extract features from
diverse sequences and ignore the effects of viewpoint changes. To overcome
these limitations, we propose a condition-adaptive graph (CAG) convolution
network that can dynamically adapt to the specific attributes of each skeleton
sequence and the corresponding view angle. In contrast to using fixed weights
for all joints and sequences, we introduce a joint-specific filter learning
(JSFL) module in the CAG method, which produces sequence-adaptive filters at
the joint level. The adaptive filters capture fine-grained patterns that are
unique to each joint, enabling the extraction of diverse spatial-temporal
information about body parts. Additionally, we design a view-adaptive topology
learning (VATL) module that generates adaptive graph topologies. These graph
topologies are used to correlate the joints adaptively according to the
specific view conditions. Thus, CAG can simultaneously adjust to various
walking styles and viewpoints. Experiments on the two most widely used datasets
(i.e., CASIA-B and OU-MVLP) show that CAG surpasses all previous skeleton-based
methods. Moreover, the recognition performance can be enhanced by simply
combining CAG with appearance-based methods, demonstrating the ability of CAG
to provide useful complementary information.The source code will be available
at https://github.com/OliverHxh/CAG.
- Abstract(参考訳): グラフ畳み込みネットワークは骨格に基づく歩行認識に広く応用されている。
この課題の重要な課題は、様々な視点で異なる被験者の歩行スタイルを区別することである。
既存の最先端手法では、様々なシーケンスから特徴を抽出し、視点変化の影響を無視するために均一な畳み込みを用いる。
これらの制約を克服するために,各骨格列の特定の属性と対応する視野角に動的に適応可能な条件適応グラフ(cag)畳み込みネットワークを提案する。
すべての関節およびシーケンスに対して固定重みを用いるのとは対照的に,CAG法では関節レベルでのシーケンス適応フィルタを生成するジョイント固有フィルタ学習(JSFL)モジュールを導入する。
適応フィルタは、各関節に特有のきめ細かいパターンを捕捉し、身体部分に関する多様な時空間情報を抽出する。
さらに,適応型グラフトポロジーを生成するvatl(view-adaptive topology learning)モジュールも設計する。
これらのグラフトポロジーは、特定のビュー条件に従って関節を適応的に相関付けるために使用される。
これにより、CAGは様々な歩行スタイルと視点を同時に調整することができる。
最も広く使われている2つのデータセット(例えばCASIA-BとOU-MVLP)の実験は、CAGが以前の骨格に基づく手法を全て上回っていることを示している。
さらに、CAGと外見に基づく手法を組み合わせることで、CAGが有用な補完情報を提供する能力を示すことで、認識性能を向上させることができる。
関連論文リスト
- UniGAP: A Universal and Adaptive Graph Upsampling Approach to Mitigate Over-Smoothing in Node Classification Tasks [8.958483386270638]
グラフデータに対する普遍的で適応的なグラフアップサンプリング手法であるUniGAPを紹介する。
グラフアップサンプリングのための普遍的なフレームワークを提供し、ほとんどの現在のメソッドを変種として包含する。
UniGAPは、既存のGNNとシームレスかつ適応的に統合できるプラグインコンポーネントとして機能する。
論文 参考訳(メタデータ) (2024-07-28T07:44:13Z) - Synergy and Diversity in CLIP: Enhancing Performance Through Adaptive Backbone Ensembling [58.50618448027103]
コントラスト言語-画像事前学習(CLIP)は画像表現学習において顕著な手法である。
本稿では,CLIPを訓練した視覚バックボーンの違いについて検討する。
方法によって、最高の単一のバックボーンよりも39.1%の精度が著しく向上する。
論文 参考訳(メタデータ) (2024-05-27T12:59:35Z) - Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network [14.361677329761672]
本稿では, 適応親和性グラフネットワーク(Adaptive Affinity-Graph Network, AAGN)を提案する。
高周波の詳細については、高周波数領域と空間領域の両方から情報を抽出するために、Body Shape Discriminator (BSD) が設計されている。
われわれのフレームワークは写真の美的魅力を著しく向上させ、すべての評価指標において最先端を達成するために、これまでのすべての作業よりはるかに上回っている。
論文 参考訳(メタデータ) (2024-04-22T08:44:10Z) - Condition-Invariant Semantic Segmentation [77.10045325743644]
我々は現在最先端のドメイン適応アーキテクチャ上で条件不変セマンティック(CISS)を実装している。
本手法は,通常の都市景観$to$ACDCベンチマークにおいて,2番目に高い性能を実現する。
CISSはBDD100K-nightやACDC-nightのようなトレーニング中に見えない領域によく一般化している。
論文 参考訳(メタデータ) (2023-05-27T03:05:07Z) - Towards Better Graph Representation Learning with Parameterized
Decomposition & Filtering [27.374515964364814]
我々は,既存のGNNモデルを統一した,新規で汎用的なフレームワークを開発する。
既存のモデルのスムーズさと増幅問題を緩和しつつ、GNNの柔軟性を高めるのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2023-05-10T12:42:31Z) - Graph Contrastive Learning for Skeleton-based Action Recognition [85.86820157810213]
骨格に基づく行動認識のためのグラフコントラスト学習フレームワークを提案する。
SkeletonGCLは、グラフをクラス識別に強制することで、シーケンス間のグラフ学習を関連付ける。
SkeletonGCLは新しいトレーニングパラダイムを確立し、現在のグラフ畳み込みネットワークにシームレスに組み込むことができる。
論文 参考訳(メタデータ) (2023-01-26T02:09:16Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Graph-based Pyramid Global Context Reasoning with a Saliency-aware
Projection for COVID-19 Lung Infections Segmentation [16.94939282349418]
グラフベースのPyramid Global Context Reasoning(Graph-PGCR)モジュールを提案する。
異種感染症間の長距離依存性をモデル化し、サイズの変化を適応させることができる。
当社のGraph-PGCRモジュールはプラグアンドプレイで、パフォーマンスを向上させるためにあらゆるアーキテクチャに統合できます。
論文 参考訳(メタデータ) (2021-03-07T02:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。