論文の概要: The Paradox of Motion: Evidence for Spurious Correlations in
Skeleton-based Gait Recognition Models
- arxiv url: http://arxiv.org/abs/2402.08320v1
- Date: Tue, 13 Feb 2024 09:33:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 15:51:51.922938
- Title: The Paradox of Motion: Evidence for Spurious Correlations in
Skeleton-based Gait Recognition Models
- Title(参考訳): 運動のパラドックス:スケルトンに基づく歩行認識モデルにおけるスプリアス相関の証拠
- Authors: Andy C\u{a}trun\u{a}, Adrian Cosma, Emilian R\u{a}doi
- Abstract要約: 本研究は、視覚に基づく歩行認識が主に動きパターンに依存しているという一般的な仮定に挑戦する。
高さ情報の除去が顕著な性能低下につながることを比較分析により示す。
本研究では,時間的情報を無視して個々のポーズを処理する空間変換器モデルを提案する。
- 参考スコア(独自算出の注目度): 4.089889918897877
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Gait, an unobtrusive biometric, is valued for its capability to identify
individuals at a distance, across external outfits and environmental
conditions. This study challenges the prevailing assumption that vision-based
gait recognition, in particular skeleton-based gait recognition, relies
primarily on motion patterns, revealing a significant role of the implicit
anthropometric information encoded in the walking sequence. We show through a
comparative analysis that removing height information leads to notable
performance degradation across three models and two benchmarks (CASIA-B and
GREW). Furthermore, we propose a spatial transformer model processing
individual poses, disregarding any temporal information, which achieves
unreasonably good accuracy, emphasizing the bias towards appearance information
and indicating spurious correlations in existing benchmarks. These findings
underscore the need for a nuanced understanding of the interplay between motion
and appearance in vision-based gait recognition, prompting a reevaluation of
the methodological assumptions in this field. Our experiments indicate that
"in-the-wild" datasets are less prone to spurious correlations, prompting the
need for more diverse and large scale datasets for advancing the field.
- Abstract(参考訳): 目立たないバイオメトリックであるgaitは、外部の服装や環境条件をまたいで、遠くにいる個人を識別する能力で評価されている。
本研究は、視覚に基づく歩行認識、特に骨格に基づく歩行認識は、主に運動パターンに依存しており、歩行シーケンスに符号化された暗黙の人文情報に重要な役割を担っているという仮定に挑戦する。
本稿では,高度情報の除去が3つのモデルと2つのベンチマーク(CASIA-BとGREW)において顕著な性能劣化をもたらすことを示す。
さらに,個々のポーズを処理し,時間的情報を無視した空間トランスフォーマモデルを提案し,不当な精度を実現し,出現情報に対するバイアスを強調し,既存のベンチマークでスプリアス相関を示す。
これらの知見は、視線に基づく歩行認識における動きと外観の相互作用の微妙な理解の必要性を浮き彫りにし、この分野における方法論的仮定の再評価を促した。
実験によれば、"in-the-wild"データセットはスプリアス相関を起こしやすいため、フィールドを前進させるためにはより多様で大規模なデータセットが必要となる。
関連論文リスト
- Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Corpus Considerations for Annotator Modeling and Scaling [9.263562546969695]
一般的に使われているユーザトークンモデルは、より複雑なモデルよりも一貫して優れています。
以上の結果から,コーパス統計とアノテータモデリング性能の関係が明らかになった。
論文 参考訳(メタデータ) (2024-04-02T22:27:24Z) - Cross-Database Liveness Detection: Insights from Comparative Biometric
Analysis [20.821562115822182]
生検は生検と生検を区別する能力である。
本研究は, 生活度検出モデルの総合的な評価を行う。
私たちの研究は、バイオメトリックセキュリティの進化するリズムをナビゲートするための青写真を提供しています。
論文 参考訳(メタデータ) (2024-01-29T15:32:18Z) - General Identifiability and Achievability for Causal Representation
Learning [33.80247458590611]
本稿では,潜伏因果グラフにおけるノード毎の2つのハードアンカップリング介入を用いて,識別可能性と達成性を評価する。
同定可能性について,未結合の介入の下で潜伏因果モデルと変数の完全回復が保証されることを示す。
さらに、この分析は、2つのハードカップリングされた介入に対して、同一ノードが介在する2つの環境に関するメタデータが知られている場合に、識別可能性の結果を回復する。
論文 参考訳(メタデータ) (2023-10-24T01:47:44Z) - Distillation-guided Representation Learning for Unconstrained Gait Recognition [50.0533243584942]
本研究では,屋外シナリオにおける人間認証のためのGADER(GAit Detection and Recognition)フレームワークを提案する。
GADERは、歩行情報を含むフレームのみを使用する新しい歩行認識手法により識別的特徴を構築する。
室内および屋外のデータセットに一貫した改善を示すため,複数の歩行ベースライン(SoTA)について評価を行った。
論文 参考訳(メタデータ) (2023-07-27T01:53:57Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Temporal Relevance Analysis for Video Action Models [70.39411261685963]
まず,CNNに基づく行動モデルにより捉えたフレーム間の時間的関係を定量化する手法を提案する。
次に、時間的モデリングがどのように影響を受けるかをよりよく理解するために、包括的な実験と詳細な分析を行います。
論文 参考訳(メタデータ) (2022-04-25T19:06:48Z) - An Enhanced Adversarial Network with Combined Latent Features for
Spatio-Temporal Facial Affect Estimation in the Wild [1.3007851628964147]
本稿では,遅延特徴に基づく時間的モデリングにより,空間的特徴と時間的特徴の両方を効率的に抽出する新しいモデルを提案する。
提案モデルは3つの主要ネットワークから成り,造語生成器,判別器,コンビネータを用いて,適応型アテンションモジュールを実現するために,敵対的な学習環境において訓練を行う。
論文 参考訳(メタデータ) (2021-02-18T04:10:12Z) - A Variational Information Bottleneck Approach to Multi-Omics Data
Integration [98.6475134630792]
本稿では,不完全な多視点観測のための深い変動情報ボトルネック (IB) 手法を提案する。
本手法は,対象物に関連のある視点内および視点間相互作用に焦点をあてるために,観測された視点の辺縁および結合表現にISBフレームワークを適用した。
実世界のデータセットの実験から、我々の手法はデータ統合から常に利益を得て、最先端のベンチマークより優れています。
論文 参考訳(メタデータ) (2021-02-05T06:05:39Z) - View-Invariant Gait Recognition with Attentive Recurrent Learning of
Partial Representations [27.33579145744285]
本稿では,まず,フレームレベルの畳み込み特徴から歩行畳み込みエネルギーマップ(GCEM)を抽出するネットワークを提案する。
次に、GCEMの分割されたビンから学ぶために双方向ニューラルネットワークを採用し、学習された部分的リカレント表現の関係を利用する。
提案手法は2つの大規模CASIA-BとOU-Mの歩行データセットで広範囲に検証されている。
論文 参考訳(メタデータ) (2020-10-18T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。