論文の概要: Learning Geometric Invariance for Gait Recognition
- arxiv url: http://arxiv.org/abs/2601.05604v1
- Date: Fri, 09 Jan 2026 07:47:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.901692
- Title: Learning Geometric Invariance for Gait Recognition
- Title(参考訳): 歩行認識のための幾何学的不変性学習
- Authors: Zengbin Wang, Junjie Li, Saihui Hou, Xu Liu, Chunshui Cao, Yongzhen Huang, Muyi Sun, Siye Wang, Man Zhang,
- Abstract要約: 異なる歩行条件の変動は、幾何変換の組合せとして概ね見なすことができる。
我々は$mathcalRRS$-Gaitという,$mathcalR$eflect-$mathcalR$otate-$mathcalS$cale不変学習フレームワークを設計する。
4つの一般的な歩行データセットの実験は、様々な歩行条件において優れた性能を示す。
- 参考スコア(独自算出の注目度): 43.26239161303881
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of gait recognition is to extract identity-invariant features of an individual under various gait conditions, e.g., cross-view and cross-clothing. Most gait models strive to implicitly learn the common traits across different gait conditions in a data-driven manner to pull different gait conditions closer for recognition. However, relatively few studies have explicitly explored the inherent relations between different gait conditions. For this purpose, we attempt to establish connections among different gait conditions and propose a new perspective to achieve gait recognition: variations in different gait conditions can be approximately viewed as a combination of geometric transformations. In this case, all we need is to determine the types of geometric transformations and achieve geometric invariance, then identity invariance naturally follows. As an initial attempt, we explore three common geometric transformations (i.e., Reflect, Rotate, and Scale) and design a $\mathcal{R}$eflect-$\mathcal{R}$otate-$\mathcal{S}$cale invariance learning framework, named ${\mathcal{RRS}}$-Gait. Specifically, it first flexibly adjusts the convolution kernel based on the specific geometric transformations to achieve approximate feature equivariance. Then these three equivariant-aware features are respectively fed into a global pooling operation for final invariance-aware learning. Extensive experiments on four popular gait datasets (Gait3D, GREW, CCPG, SUSTech1K) show superior performance across various gait conditions.
- Abstract(参考訳): 歩行認識の目的は、様々な歩行条件(例えば、クロスビュー、クロスクロース)の下で、個人のアイデンティティ不変の特徴を抽出することである。
ほとんどの歩行モデルは、異なる歩行条件の共通特性をデータ駆動方式で暗黙的に学習し、異なる歩行条件を認識に近づけようとしている。
しかしながら、異なる歩行条件の間の固有の関係を明示的に研究する研究は比較的少ない。
この目的のために、異なる歩行条件間の接続を確立し、異なる歩行条件の変動を幾何変換の組合せとして概観することができる、歩行認識を実現するための新しい視点を提案する。
この場合、幾何変換のタイプを決定し、幾何学的不変性を達成すれば、恒等不変性は自然に従う。
最初の試みとして、3つの一般的な幾何学変換(リフレクション、ロータテ、スケール)を探索し、$\mathcal{R}$eflect-$\mathcal{R}$otate-$\mathcal{S}$cale invariance learning framework、${\mathcal{RRS}}$-Gaitを設計する。
具体的には、まず、特定の幾何変換に基づいて畳み込みカーネルを柔軟に調整し、近似的な特徴同値を実現する。
そして、これら3つの同変認識特徴を、最終不変認識学習のための大域プール操作にそれぞれ供給する。
4つの一般的な歩行データセット(Gait3D, GREW, CCPG, SUSTech1K)の大規模な実験は、様々な歩行条件において優れた性能を示す。
関連論文リスト
- GAGrasp: Geometric Algebra Diffusion for Dexterous Grasping [3.9108453320793326]
本稿では, ゆるやかなグリップ生成のための新しいフレームワークであるGAGraspを提案する。
本手法は,SE(3)対称性制約を直接アーキテクチャに符号化することにより,データとパラメータの効率を向上する。
我々は、物理インフォームド・リファインメント・レイヤを組み込み、生成したグリップが物理的に妥当で安定であることを保証する。
論文 参考訳(メタデータ) (2025-03-06T06:00:55Z) - Self-Supervised Learning from Non-Object Centric Images with a Geometric
Transformation Sensitive Architecture [7.825153552141346]
本稿では幾何学的変換に敏感な幾何学的変換感性アーキテクチャを提案する。
本手法は, 回転予測や変換の異なる目標の利用により, 学生に敏感になるよう促す。
提案手法は,非対象中心画像を事前学習データとして用いる際の性能向上を示す。
論文 参考訳(メタデータ) (2023-04-17T06:32:37Z) - Equivalence Between SE(3) Equivariant Networks via Steerable Kernels and
Group Convolution [90.67482899242093]
近年, 入力の回転と変換において等価な3次元データに対して, ニューラルネットワークを設計するための幅広い手法が提案されている。
両手法とその等価性を詳細に解析し,その2つの構成をマルチビュー畳み込みネットワークに関連付ける。
また、同値原理から新しいTFN非線形性を導出し、実用的なベンチマークデータセット上でテストする。
論文 参考訳(メタデータ) (2022-11-29T03:42:11Z) - 3D Equivariant Graph Implicit Functions [51.5559264447605]
局所的詳細のモデリングを容易にする同変層を持つグラフ暗黙関数の新しいファミリを導入する。
提案手法は,ShapeNet再構成作業において既存の回転同変暗黙関数を0.69から0.89に改善する。
論文 参考訳(メタデータ) (2022-03-31T16:51:25Z) - Revisiting Transformation Invariant Geometric Deep Learning: An Initial Representation Perspective [38.314914702299056]
我々は幾何学的データのための単純で汎用的なプラグインであるTransform In Neural Networks (TinvNN)を提案する。
具体的には,多次元スケーリングを改良することにより,変換不変性と距離保存初期点表現を実現する。
我々は、TinvNNが変換不変性を厳密に保証し、既存のニューラルネットワークと組み合わせられるほど汎用的で柔軟なことを証明した。
論文 参考訳(メタデータ) (2021-12-23T03:52:33Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z) - Spherical Feature Transform for Deep Metric Learning [58.35971328774927]
本研究は,新しい球面特徴変換手法を提案する。
これは、クラス間の同一共分散の仮定を、超球面上の異なるクラスの類似共分散の仮定に緩和する。
本研究では,2つの異なる変換間の関係について,簡便かつ効果的な学習法と深度解析を行う。
論文 参考訳(メタデータ) (2020-08-04T11:32:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。