論文の概要: Database-Agnostic Gait Enrollment using SetTransformers
- arxiv url: http://arxiv.org/abs/2505.02815v1
- Date: Mon, 05 May 2025 17:42:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.757265
- Title: Database-Agnostic Gait Enrollment using SetTransformers
- Title(参考訳): Set Transformer を用いたデータベース非依存歩行登録
- Authors: Nicoleta Basoc, Adrian Cosma, Andy Cǎtrunǎ, Emilian Rǎdoi,
- Abstract要約: オープンセット歩行学習のためのトランスフォーマーベースのフレームワークを提案する。
提案手法は,データセット非依存と認識-アーキテクチャ非依存の両方である。
提案手法はフレキシブルで,異なるシナリオでの登録を正確に行うことができ,従来の手法と比較してデータによるスケーリングが優れていることを示す。
- 参考スコア(独自算出の注目度): 3.3311266423308252
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Gait recognition has emerged as a powerful tool for unobtrusive and long-range identity analysis, with growing relevance in surveillance and monitoring applications. Although recent advances in deep learning and large-scale datasets have enabled highly accurate recognition under closed-set conditions, real-world deployment demands open-set gait enrollment, which means determining whether a new gait sample corresponds to a known identity or represents a previously unseen individual. In this work, we introduce a transformer-based framework for open-set gait enrollment that is both dataset-agnostic and recognition-architecture-agnostic. Our method leverages a SetTransformer to make enrollment decisions based on the embedding of a probe sample and a context set drawn from the gallery, without requiring task-specific thresholds or retraining for new environments. By decoupling enrollment from the main recognition pipeline, our model is generalized across different datasets, gallery sizes, and identity distributions. We propose an evaluation protocol that uses existing datasets in different ratios of identities and walks per identity. We instantiate our method using skeleton-based gait representations and evaluate it on two benchmark datasets (CASIA-B and PsyMo), using embeddings from three state-of-the-art recognition models (GaitGraph, GaitFormer, and GaitPT). We show that our method is flexible, is able to accurately perform enrollment in different scenarios, and scales better with data compared to traditional approaches. We will make the code and dataset scenarios publicly available.
- Abstract(参考訳): 歩行認識は、監視や監視アプリケーションとの関連性を高めるとともに、邪魔にならない、長期にわたるアイデンティティ分析のための強力なツールとして登場した。
近年のディープラーニングと大規模データセットの進歩により、クローズドセット条件下での高精度な認識が可能になったが、現実の展開要求は、新しい歩行サンプルが既知のアイデンティティと一致しているか、あるいは以前に見つからなかった個人を表すかを判断する、オープンセットの歩行登録が要求される。
本研究では,データセット非依存と認識-アーキテクチャ非依存の両方を対象とする,オープンセット歩行学習のためのトランスフォーマーベースのフレームワークを提案する。
提案手法では,SetTransformerを用いて,探索サンプルの埋め込みとギャラリーからのコンテキストセットに基づいて,タスク固有のしきい値や新しい環境の再学習を必要とせず,登録決定を行う。
メイン認識パイプラインからの登録を分離することで、我々のモデルは異なるデータセット、ギャラリーサイズ、アイデンティティ分布にまたがって一般化される。
本稿では,既存データセットを同一性と同一性ごとのウォークの異なる比率で利用する評価プロトコルを提案する。
本稿では,3つの最先端認識モデル (GaitGraph, GaitFormer, GaitPT) の埋め込みを用いて, 骨格に基づく歩行表現を用いて本手法をインスタンス化し, 2つのベンチマークデータセット (CASIA-B, PsyMo) 上で評価する。
提案手法はフレキシブルで,異なるシナリオでの登録を正確に行うことができ,従来の手法と比較してデータによるスケーリングが優れていることを示す。
コードとデータセットのシナリオを公開します。
関連論文リスト
- PATFinger: Prompt-Adapted Transferable Fingerprinting against Unauthorized Multimodal Dataset Usage [19.031839603738057]
マルチモーダルデータセットは、クロスモーダルセマンティクスを提供することで、事前訓練されたビジョン適応モデルに活用することができる。
本稿では,PATFingerと呼ばれる新しいプロンプト言語変換可能なフィンガープリント手法を提案する。
提案手法では,モデルにトリガを学習させる代わりに,固有データセット属性を指紋として利用する。
論文 参考訳(メタデータ) (2025-04-15T09:53:02Z) - Straight Through Gumbel Softmax Estimator based Bimodal Neural Architecture Search for Audio-Visual Deepfake Detection [6.367999777464464]
マルチモーダルディープフェイク検出器は 従来の融合法に依存している 多数決ルールや アンサンブル投票など
本稿では,マルチモーダル融合モデルアーキテクチャを検索するための包括的アプローチを提供する,Straight-through Gumbel-Softmaxフレームワークを提案する。
FakeAVCelebとSWAN-DFデータセットの実験では、最小のモデルパラメータでAUCの94.4%が達成された。
論文 参考訳(メタデータ) (2024-06-19T09:26:22Z) - How to Evaluate Entity Resolution Systems: An Entity-Centric Framework with Application to Inventor Name Disambiguation [1.7812428873698403]
本稿では,要約統計をモニタリングする統合フレームワークと統合したエンティティ中心のデータラベリング手法を提案する。
これらのベンチマークデータセットは、モデルトレーニングやさまざまな評価タスクに使用できる。
論文 参考訳(メタデータ) (2024-04-08T15:53:29Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain
Gait Recognition [77.77786072373942]
本稿では、教師なしクロスドメイン歩行認識のための領域ギャップを橋渡しするTransferable Neighborhood Discovery (TraND) フレームワークを提案する。
我々は、潜在空間におけるラベルなしサンプルの自信ある近傍を自動的に発見するために、エンドツーエンドのトレーニング可能なアプローチを設計する。
提案手法は,CASIA-BとOU-LPの2つの公開データセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-02-09T03:07:07Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。