論文の概要: The Paradox of Motion: Evidence for Spurious Correlations in
Skeleton-based Gait Recognition Models
- arxiv url: http://arxiv.org/abs/2402.08320v1
- Date: Tue, 13 Feb 2024 09:33:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 15:51:51.922938
- Title: The Paradox of Motion: Evidence for Spurious Correlations in
Skeleton-based Gait Recognition Models
- Title(参考訳): 運動のパラドックス:スケルトンに基づく歩行認識モデルにおけるスプリアス相関の証拠
- Authors: Andy C\u{a}trun\u{a}, Adrian Cosma, Emilian R\u{a}doi
- Abstract要約: 本研究は、視覚に基づく歩行認識が主に動きパターンに依存しているという一般的な仮定に挑戦する。
高さ情報の除去が顕著な性能低下につながることを比較分析により示す。
本研究では,時間的情報を無視して個々のポーズを処理する空間変換器モデルを提案する。
- 参考スコア(独自算出の注目度): 4.089889918897877
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Gait, an unobtrusive biometric, is valued for its capability to identify
individuals at a distance, across external outfits and environmental
conditions. This study challenges the prevailing assumption that vision-based
gait recognition, in particular skeleton-based gait recognition, relies
primarily on motion patterns, revealing a significant role of the implicit
anthropometric information encoded in the walking sequence. We show through a
comparative analysis that removing height information leads to notable
performance degradation across three models and two benchmarks (CASIA-B and
GREW). Furthermore, we propose a spatial transformer model processing
individual poses, disregarding any temporal information, which achieves
unreasonably good accuracy, emphasizing the bias towards appearance information
and indicating spurious correlations in existing benchmarks. These findings
underscore the need for a nuanced understanding of the interplay between motion
and appearance in vision-based gait recognition, prompting a reevaluation of
the methodological assumptions in this field. Our experiments indicate that
"in-the-wild" datasets are less prone to spurious correlations, prompting the
need for more diverse and large scale datasets for advancing the field.
- Abstract(参考訳): 目立たないバイオメトリックであるgaitは、外部の服装や環境条件をまたいで、遠くにいる個人を識別する能力で評価されている。
本研究は、視覚に基づく歩行認識、特に骨格に基づく歩行認識は、主に運動パターンに依存しており、歩行シーケンスに符号化された暗黙の人文情報に重要な役割を担っているという仮定に挑戦する。
本稿では,高度情報の除去が3つのモデルと2つのベンチマーク(CASIA-BとGREW)において顕著な性能劣化をもたらすことを示す。
さらに,個々のポーズを処理し,時間的情報を無視した空間トランスフォーマモデルを提案し,不当な精度を実現し,出現情報に対するバイアスを強調し,既存のベンチマークでスプリアス相関を示す。
これらの知見は、視線に基づく歩行認識における動きと外観の相互作用の微妙な理解の必要性を浮き彫りにし、この分野における方法論的仮定の再評価を促した。
実験によれば、"in-the-wild"データセットはスプリアス相関を起こしやすいため、フィールドを前進させるためにはより多様で大規模なデータセットが必要となる。
関連論文リスト
- Spurious Correlations in Machine Learning: A Survey [69.89249134046086]
機械学習システムは、入力の偏りのある特徴と対応するラベルの間の急激な相関に敏感である。
これらの特徴とそのラベルとの相関は"spurious"として知られている。
我々は、機械学習モデルにおける素早い相関に対処する現在の最先端の手法の分類とともに、この問題を包括的にレビューする。
論文 参考訳(メタデータ) (2024-02-20T04:49:34Z) - Cross-Database Liveness Detection: Insights from Comparative Biometric
Analysis [20.821562115822182]
生検は生検と生検を区別する能力である。
本研究は, 生活度検出モデルの総合的な評価を行う。
私たちの研究は、バイオメトリックセキュリティの進化するリズムをナビゲートするための青写真を提供しています。
論文 参考訳(メタデータ) (2024-01-29T15:32:18Z) - Unveiling the Potential of Probabilistic Embeddings in Self-Supervised
Learning [4.124934010794795]
自己教師付き学習は、ラベルのないデータから意味のある表現をモデルが取得できるようにすることで、機械学習を前進させる上で重要な役割を担っている。
本稿では,情報ボトルネックに対する確率的モデリングの影響について検討し,情報圧縮と情報保存のトレードオフについて述べる。
以上の結果から,損失空間に新たなボトルネックを導入することにより,アウト・オブ・ディストリビューションの事例を検出する能力が著しく向上することが示唆された。
論文 参考訳(メタデータ) (2023-10-27T12:01:16Z) - General Identifiability and Achievability for Causal Representation
Learning [33.80247458590611]
本稿では,潜伏因果グラフにおけるノード毎の2つのハードアンカップリング介入を用いて,識別可能性と達成性を評価する。
同定可能性について,未結合の介入の下で潜伏因果モデルと変数の完全回復が保証されることを示す。
さらに、この分析は、2つのハードカップリングされた介入に対して、同一ノードが介在する2つの環境に関するメタデータが知られている場合に、識別可能性の結果を回復する。
論文 参考訳(メタデータ) (2023-10-24T01:47:44Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Temporal Relevance Analysis for Video Action Models [70.39411261685963]
まず,CNNに基づく行動モデルにより捉えたフレーム間の時間的関係を定量化する手法を提案する。
次に、時間的モデリングがどのように影響を受けるかをよりよく理解するために、包括的な実験と詳細な分析を行います。
論文 参考訳(メタデータ) (2022-04-25T19:06:48Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - An Enhanced Adversarial Network with Combined Latent Features for
Spatio-Temporal Facial Affect Estimation in the Wild [1.3007851628964147]
本稿では,遅延特徴に基づく時間的モデリングにより,空間的特徴と時間的特徴の両方を効率的に抽出する新しいモデルを提案する。
提案モデルは3つの主要ネットワークから成り,造語生成器,判別器,コンビネータを用いて,適応型アテンションモジュールを実現するために,敵対的な学習環境において訓練を行う。
論文 参考訳(メタデータ) (2021-02-18T04:10:12Z) - A Variational Information Bottleneck Approach to Multi-Omics Data
Integration [98.6475134630792]
本稿では,不完全な多視点観測のための深い変動情報ボトルネック (IB) 手法を提案する。
本手法は,対象物に関連のある視点内および視点間相互作用に焦点をあてるために,観測された視点の辺縁および結合表現にISBフレームワークを適用した。
実世界のデータセットの実験から、我々の手法はデータ統合から常に利益を得て、最先端のベンチマークより優れています。
論文 参考訳(メタデータ) (2021-02-05T06:05:39Z) - View-Invariant Gait Recognition with Attentive Recurrent Learning of
Partial Representations [27.33579145744285]
本稿では,まず,フレームレベルの畳み込み特徴から歩行畳み込みエネルギーマップ(GCEM)を抽出するネットワークを提案する。
次に、GCEMの分割されたビンから学ぶために双方向ニューラルネットワークを採用し、学習された部分的リカレント表現の関係を利用する。
提案手法は2つの大規模CASIA-BとOU-Mの歩行データセットで広範囲に検証されている。
論文 参考訳(メタデータ) (2020-10-18T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。