論文の概要: FaceSORT: a Multi-Face Tracking Method based on Biometric and Appearance Features
- arxiv url: http://arxiv.org/abs/2501.11741v1
- Date: Mon, 20 Jan 2025 21:00:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:22:28.824905
- Title: FaceSORT: a Multi-Face Tracking Method based on Biometric and Appearance Features
- Title(参考訳): FaceSORT:生体・外観特徴に基づく多面追跡手法
- Authors: Robert Jöchl, Andreas Uhl,
- Abstract要約: 本研究では,StrongSortにインスパイアされた多面追跡手法であるFaceSORTを提案する。
部分閉塞面や横面の問題を緩和するために、生体顔の特徴と視覚的外観特徴を結合する。
すべての実験は、新しい多面追跡データセットとChokePointデータセットのサブセットで実行される。
- 参考スコア(独自算出の注目度): 4.088355251010862
- License:
- Abstract: Tracking multiple faces is a difficult problem, as there may be partially occluded or lateral faces. In multiple face tracking, association is typically based on (biometric) face features. However, the models used to extract these face features usually require frontal face images, which can limit the tracking performance. In this work, a multi-face tracking method inspired by StrongSort, FaceSORT, is proposed. To mitigate the problem of partially occluded or lateral faces, biometric face features are combined with visual appearance features (i.e., generated by a generic object classifier), with both features are extracted from the same face patch. A comprehensive experimental evaluation is performed, including a comparison of different face descriptors, an evaluation of different parameter settings, and the application of a different similarity metric. All experiments are conducted with a new multi-face tracking dataset and a subset of the ChokePoint dataset. The `Paris Lodron University Salzburg Faces in a Queue' dataset consists of a total of seven fully annotated sequences (12730 frames) and is made publicly available as part of this work. Together with this dataset, annotations of 6 sequences from the ChokePoint dataset are also provided.
- Abstract(参考訳): 複数の顔を追跡することは難しい問題であり、顔の一部が隠されているか、側面が隠されている可能性がある。
複数の顔追跡において、アソシエーションは典型的には(バイオメトリック)顔の特徴に基づいている。
しかしながら、これらの顔の特徴を抽出するために使用されるモデルは、通常、正面の顔画像を必要とするため、追跡性能を制限できる。
本研究では,StrongSortにインスパイアされた多面追跡手法であるFaceSORTを提案する。
部分閉塞または横面の問題を軽減するため、生体顔特徴と視覚的外観特徴(ジェネリックオブジェクト分類器によって生成される)を組み合わせ、両方の特徴を同一の顔パッチから抽出する。
異なる顔記述子の比較、異なるパラメータ設定の評価、異なる類似度メートル法の適用を含む総合的な実験評価を行う。
すべての実験は、新しい多面追跡データセットとChokePointデータセットのサブセットで実行される。
Paris Lodron University Salzburg Faces in a Queue'データセットは、合計で7つの完全な注釈付きシーケンス(12730フレーム)で構成されており、この研究の一部として公開されている。
このデータセットとともに、ChokePointデータセットからの6つのシーケンスのアノテーションも提供される。
関連論文リスト
- Task-adaptive Q-Face [75.15668556061772]
本稿では,タスク適応型マルチタスク顔分析手法Q-Faceを提案する。
Q-Faceは統合されたモデルで複数の顔分析タスクを同時に実行する。
本手法は,顔表情認識,行動単位検出,顔属性分析,年齢推定,顔ポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-05-15T03:13:11Z) - FaceXFormer: A Unified Transformer for Facial Analysis [59.94066615853198]
FaceXFormerは、9つの顔分析タスクを実行することができるエンドツーエンドの統一トランスフォーマーモデルである。
これらのタスクには、顔解析、ランドマーク検出、頭部ポーズ推定、属性予測、年齢、性別、人種、表情、顔の可視性などが含まれる。
本稿では,顔トークンとタスクトークンを共同処理し,汎用的で堅牢な顔表現を学習する新しいパラメータ効率デコーダFaceXを提案する。
論文 参考訳(メタデータ) (2024-03-19T17:58:04Z) - Let's Get the FACS Straight -- Reconstructing Obstructed Facial Features [5.7843271011811614]
本稿では,障害のある顔の部位を再構築し,繰り返し微調整を行う作業を避けることを提案する。
CycleGANアーキテクチャを使用することで、マッチしたペアの要求を解消できる。
このスコアは、センサーを妨害することなく、ビデオに似ています。
論文 参考訳(メタデータ) (2023-11-09T09:09:20Z) - SwinFace: A Multi-task Transformer for Face Recognition, Expression
Recognition, Age Estimation and Attribute Estimation [60.94239810407917]
本論文では,単一スウィントランスを用いた顔認識,表情認識,年齢推定,顔属性推定のための多目的アルゴリズムを提案する。
複数のタスク間の競合に対処するため、マルチレベルチャネル注意(MLCA)モジュールをタスク固有の分析に統合する。
実験の結果,提案したモデルでは顔の理解が良く,全てのタスクにおいて優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-08-22T15:38:39Z) - Multiface: A Dataset for Neural Face Rendering [108.44505415073579]
本研究では,新しいマルチビュー,高解像度のヒューマン・フェイス・データセットであるMultifaceを提案する。
顔のパフォーマンスの高解像度同期映像をキャプチャする大規模なマルチカメラ装置であるMugsyを紹介する。
Multifaceの目的は、学術コミュニティにおける高品質データへのアクセシビリティのギャップを埋め、VRテレプレゼンスの研究を可能にすることである。
論文 参考訳(メタデータ) (2022-07-22T17:55:39Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Real-Time Facial Expression Recognition using Facial Landmarks and
Neural Networks [0.0]
本稿では,特徴抽出,7つの感情の分類,表情認識をリアルタイムに行うアルゴリズムを提案する。
前処理アルゴリズムに基づいてマルチ層パーセプトロンニューラルネットワークをトレーニングする。
3層はこれらの特徴ベクトルを使って訓練され、テストセットでは96%の精度が得られた。
論文 参考訳(メタデータ) (2022-01-31T21:38:30Z) - FaceOcc: A Diverse, High-quality Face Occlusion Dataset for Human Face
Extraction [3.8502825594372703]
隠蔽は野生の顔画像にしばしば発生し、ランドマーク検出や3D再構成、顔認識といった顔関連の課題に悩まされる。
本稿では,CelebA本社とインターネットから手動で顔の隠蔽をラベル付けした新しい顔のセグメンテーションデータセットを提案する。
簡単な顔分割モデルの訓練を行ったが,SOTA性能が得られ,提案したデータセットの有効性を実証した。
論文 参考訳(メタデータ) (2022-01-20T19:44:18Z) - EDFace-Celeb-1M: Benchmarking Face Hallucination with a Million-scale
Dataset [92.537021496096]
近年の深層顔の幻覚法は,超解像性難分解性顔画像において顕著な性能を示した。
したがって、これらのアルゴリズムが公衆の顔の幻覚データセット上でどのように機能するかは不明である。
本稿では,Ethnically Diverse Face データセット EDFace-Celeb-1M を構築し,顔幻覚のためのベンチマークタスクを設計する。
論文 参考訳(メタデータ) (2021-10-11T06:53:24Z) - An Efficient Multitask Neural Network for Face Alignment, Head Pose
Estimation and Face Tracking [9.39854778804018]
効率的なマルチタスク顔アライメント、顔追跡、頭部ポーズ推定ネットワーク(ATPN)を提案します。
ATPNは従来の最先端手法に比べて性能が向上し、パラメータやFLOPSは少ない。
論文 参考訳(メタデータ) (2021-03-13T04:41:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。