論文の概要: MimicGait: A Model Agnostic approach for Occluded Gait Recognition using Correlational Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2501.15666v1
- Date: Sun, 26 Jan 2025 20:23:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:56:21.949157
- Title: MimicGait: A Model Agnostic approach for Occluded Gait Recognition using Correlational Knowledge Distillation
- Title(参考訳): MimicGait:相関知識蒸留を用いた咬合歩行認識のためのモデル非依存アプローチ
- Authors: Ayush Gupta, Rama Chellappa,
- Abstract要約: 我々は,オクルージョンの存在下で歩行認識のためのモデルに依存しないアプローチであるMimicGaitを提案する。
対象者の閉鎖歩行パターンにおけるシーケンス間相関とシーケンス内相関の両方を捉えるために,マルチインスタンス相関蒸留損失を用いてネットワークを訓練する。
我々は,GREW,Gait3D,BRIARといった実世界のデータセットに対するアプローチの有効性を実証する。
- 参考スコア(独自算出の注目度): 40.75942030089628
- License:
- Abstract: Gait recognition is an important biometric technique over large distances. State-of-the-art gait recognition systems perform very well in controlled environments at close range. Recently, there has been an increased interest in gait recognition in the wild prompted by the collection of outdoor, more challenging datasets containing variations in terms of illumination, pitch angles, and distances. An important problem in these environments is that of occlusion, where the subject is partially blocked from camera view. While important, this problem has received little attention. Thus, we propose MimicGait, a model-agnostic approach for gait recognition in the presence of occlusions. We train the network using a multi-instance correlational distillation loss to capture both inter-sequence and intra-sequence correlations in the occluded gait patterns of a subject, utilizing an auxiliary Visibility Estimation Network to guide the training of the proposed mimic network. We demonstrate the effectiveness of our approach on challenging real-world datasets like GREW, Gait3D and BRIAR. We release the code in https://github.com/Ayush-00/mimicgait.
- Abstract(参考訳): 歩行認識は遠距離における重要な生体計測技術である。
最先端の歩行認識システムは、近距離で制御された環境で非常によく機能する。
近年、照明、ピッチ角、距離のバリエーションを含む、より困難なデータセットの収集によって、野生での歩行認識への関心が高まっている。
これらの環境における重要な問題は、被写体がカメラビューから部分的にブロックされている閉塞性である。
重要な問題ではあるが、この問題はほとんど注目されていない。
そこで我々は,オクルージョンの存在下で歩行認識のためのモデルに依存しないアプローチであるMimicGaitを提案する。
提案する模擬ネットワークのトレーニングを補助的視認性推定ネットワークを用いて,マルチインスタンス相関蒸留損失を用いてトレーニングし,対象者の閉鎖歩行パターンにおけるシーケンス間相関とシーケンス内相関の両方を捕捉する。
我々は,GREW,Gait3D,BRIARといった実世界のデータセットに対するアプローチの有効性を実証する。
ソースコードはhttps://github.com/Ayush-00/mimicgait.comで公開しています。
関連論文リスト
- DiffGAD: A Diffusion-based Unsupervised Graph Anomaly Detector [17.191834562399293]
拡散型グラフ異常検出器(DiffGAD)を提案する。
DiffGADの核心は、未熟な宇宙学習のパラダイムであり、それを差別的コンテンツで導くことによって、その習熟度を高めるために細心の注意を払って設計されている。
6つの実世界および大規模データセットを用いて実施したDiffGADの総合評価により,その異常な性能が示された。
論文 参考訳(メタデータ) (2024-10-09T05:02:56Z) - Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - GCAM: Gaussian and causal-attention model of food fine-grained recognition [5.198198193921202]
本稿では,細粒度物体認識のためのガウス的・因果的アテンションモデルを提案する。
不均一なデータ分布から生じるデータドリフトに対処するために、我々は反実的推論アプローチを採用する。
実験により,GCAMはETH-FOOD101, UECFOOD256, Vireo-FOOD172データセットの最先端手法を上回ることがわかった。
論文 参考訳(メタデータ) (2024-03-18T03:39:54Z) - The Paradox of Motion: Evidence for Spurious Correlations in
Skeleton-based Gait Recognition Models [4.089889918897877]
本研究は、視覚に基づく歩行認識が主に動きパターンに依存しているという一般的な仮定に挑戦する。
高さ情報の除去が顕著な性能低下につながることを比較分析により示す。
本研究では,時間的情報を無視して個々のポーズを処理する空間変換器モデルを提案する。
論文 参考訳(メタデータ) (2024-02-13T09:33:12Z) - Implicit neural representation for change detection [15.741202788959075]
点雲の変化を検出する最も一般的なアプローチは、教師付き手法に基づいている。
Inlicit Neural Representation (INR) for continuous shape reconstruction と Gaussian Mixture Model for categorising change の2つのコンポーネントからなる教師なしアプローチを提案する。
本手法を都市スプロールのためのシミュレーションLiDAR点雲からなるベンチマークデータセットに適用する。
論文 参考訳(メタデータ) (2023-07-28T09:26:00Z) - BOURNE: Bootstrapped Self-supervised Learning Framework for Unified
Graph Anomaly Detection [50.26074811655596]
自己指導型自己学習(BOURNE)に基づく新しい統合グラフ異常検出フレームワークを提案する。
ノードとエッジ間のコンテキスト埋め込みを交換することで、ノードとエッジの異常を相互に検出できる。
BOURNEは、負のサンプリングを必要としないため、大きなグラフを扱う際の効率を高めることができる。
論文 参考訳(メタデータ) (2023-07-28T00:44:57Z) - Distillation-guided Representation Learning for Unconstrained Gait Recognition [50.0533243584942]
本研究では,屋外シナリオにおける人間認証のためのGADER(GAit Detection and Recognition)フレームワークを提案する。
GADERは、歩行情報を含むフレームのみを使用する新しい歩行認識手法により識別的特徴を構築する。
室内および屋外のデータセットに一貫した改善を示すため,複数の歩行ベースライン(SoTA)について評価を行った。
論文 参考訳(メタデータ) (2023-07-27T01:53:57Z) - TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain
Gait Recognition [77.77786072373942]
本稿では、教師なしクロスドメイン歩行認識のための領域ギャップを橋渡しするTransferable Neighborhood Discovery (TraND) フレームワークを提案する。
我々は、潜在空間におけるラベルなしサンプルの自信ある近傍を自動的に発見するために、エンドツーエンドのトレーニング可能なアプローチを設計する。
提案手法は,CASIA-BとOU-LPの2つの公開データセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-02-09T03:07:07Z) - Video Anomaly Detection by Estimating Likelihood of Representations [21.879366166261228]
ビデオ異常は、モーション表現、オブジェクトのローカライゼーション、アクション認識など、多くのサブタスクを解決するため、困難なタスクである。
伝統的に、この課題に対する解決策は、これらの特徴の空間的接続を無視しながら、ビデオフレームとその低次元特徴のマッピングに焦点を当ててきた。
最近のソリューションでは、K-Meansのようなハードクラスタリング技術を用いてこれらの空間的接続を分析することや、潜伏した特徴を一般的な理解にマップするためにニューラルネットワークを適用することに焦点を当てている。
潜在特徴空間における映像異常を解決するために,このタスクを密度推定問題に転送するための深い確率モデルを提案する。
論文 参考訳(メタデータ) (2020-12-02T19:16:22Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。