論文の概要: WSD: Wild Selfie Dataset for Face Recognition in Selfie Images
- arxiv url: http://arxiv.org/abs/2302.07245v1
- Date: Tue, 14 Feb 2023 18:43:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-15 14:31:17.627447
- Title: WSD: Wild Selfie Dataset for Face Recognition in Selfie Images
- Title(参考訳): WSD:自撮り画像の顔認識のための野生の自撮りデータセット
- Authors: Laxman Kumarapu, Shiv Ram Dubey, Snehasis Mukherjee, Parkhi Mohan,
Sree Pragna Vinnakoti, Subhash Karthikeya
- Abstract要約: 我々は、異なるスマートフォンのセルフィーカメラから画像をキャプチャするWild Selfieデータセット(WSD)を開発した。
WSDデータセットには42人の画像45,424枚が含まれている。
各被験者の平均画像数は1,082で、各被験者の最大画像数は518と2,634である。
- 参考スコア(独自算出の注目度): 13.356502206849106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise of handy smart phones in the recent years, the trend of
capturing selfie images is observed. Hence efficient approaches are required to
be developed for recognising faces in selfie images. Due to the short distance
between the camera and face in selfie images, and the different visual effects
offered by the selfie apps, face recognition becomes more challenging with
existing approaches. A dataset is needed to be developed to encourage the study
to recognize faces in selfie images. In order to alleviate this problem and to
facilitate the research on selfie face images, we develop a challenging Wild
Selfie Dataset (WSD) where the images are captured from the selfie cameras of
different smart phones, unlike existing datasets where most of the images are
captured in controlled environment. The WSD dataset contains 45,424 images from
42 individuals (i.e., 24 female and 18 male subjects), which are divided into
40,862 training and 4,562 test images. The average number of images per subject
is 1,082 with minimum and maximum number of images for any subject are 518 and
2,634, respectively. The proposed dataset consists of several challenges,
including but not limited to augmented reality filtering, mirrored images,
occlusion, illumination, scale, expressions, view-point, aspect ratio, blur,
partial faces, rotation, and alignment. We compare the proposed dataset with
existing benchmark datasets in terms of different characteristics. The
complexity of WSD dataset is also observed experimentally, where the
performance of the existing state-of-the-art face recognition methods is poor
on WSD dataset, compared to the existing datasets. Hence, the proposed WSD
dataset opens up new challenges in the area of face recognition and can be
beneficial to the community to study the specific challenges related to selfie
images and develop improved methods for face recognition in selfie images.
- Abstract(参考訳): 近年,携帯端末の普及に伴い,自撮り画像の撮影傾向が注目されている。
したがって、セルフィー画像中の顔を認識するための効率的なアプローチを開発する必要がある。
セルフィー画像のカメラと顔の距離が短いことと、セルフィーアプリの視覚効果が異なるため、既存のアプローチでは顔認識がより困難になる。
自撮り画像の顔を認識するためにデータセットを開発する必要がある。
この問題を緩和し,自撮り顔画像の研究を容易にするために,携帯電話の自撮りカメラから画像を取り出す「野生自撮りデータセット(WSD)」を開発した。
wsdデータセットには42人(女性24人、男性18人)の45,424枚の画像が含まれており、それぞれ40,862個のトレーニングと4,562個のテスト画像に分割されている。
各被験者の平均画像数は1,082で、各被験者の最大画像数は518と2,634である。
提案したデータセットは,拡張現実フィルタリング,ミラー画像,オクルージョン,照明,スケール,表現,視点,アスペクト比,ぼやけた顔,回転,アライメントなど,いくつかの課題で構成されている。
提案するデータセットと既存のベンチマークデータセットを異なる特性で比較する。
WSDデータセットの複雑さも実験的に観察され、既存の最先端の顔認識手法の性能は、既存のデータセットと比較してWSDデータセットでは劣っている。
したがって、提案されたwsdデータセットは、顔認識の分野で新たな課題を提起し、自撮り画像に関する特定の課題を調査し、自撮り画像における顔認識の改善方法を開発するコミュニティにとって有益である。
関連論文リスト
- RealFace -- Pedestrian Face Dataset [0.0]
Real Faceデータセットは、11,000以上の画像と、さまざまな環境下で検出された55,000以上の顔で構成されている。
データセットは現実世界のシナリオに重点を置いているため、実用アプリケーションには特に関係がある。
データセットが提示する課題は、現実世界の監視アプリケーションで直面する困難と一致している。
論文 参考訳(メタデータ) (2024-08-30T22:31:48Z) - Video Question Answering for People with Visual Impairments Using an Egocentric 360-Degree Camera [2.427410108595295]
本稿では,視覚障害者が直面する日常的課題,例えば情報へのアクセス制限,ナビゲーションの困難,社会的相互作用への障壁について論じる。
これらの課題を軽減するために、我々は新しい視覚的質問応答データセットを導入する。
ビデオは360度エゴセントリックなウェアラブルカメラで撮影され、周囲全体を観察することができる。
論文 参考訳(メタデータ) (2024-05-30T08:02:05Z) - SDFD: Building a Versatile Synthetic Face Image Dataset with Diverse Attributes [14.966767182001755]
顔の多様性の幅広いスペクトルをキャプチャする合成顔画像データセットを生成する手法を提案する。
具体的には、我々のアプローチは人口統計学とバイオメトリックスを統合するだけでなく、メイクアップ、ヘアスタイル、アクセサリーといった非永続的な特徴も統合しています。
これらのプロンプトは、高品質なリアル画像の包括的なデータセットを生成する際に、最先端のテキスト・ツー・イメージモデルを導く。
論文 参考訳(メタデータ) (2024-04-26T08:51:31Z) - Video Recognition in Portrait Mode [98.3393666122704]
ポートレートモードビデオ認識のための最初のデータセットであるPortraitMode-400を開発した。
画像フォーマット(画像モードとランドスケープモード)が、異なるフォーマットによる認識精度と空間バイアスに与える影響を包括的に分析する。
本研究では,データ拡張の選択,評価手順,時間的情報の重要性,音声モダリティの役割など,ポートレートモード映像認識の重要な側面を探求する実験を設計する。
論文 参考訳(メタデータ) (2023-12-21T11:30:02Z) - Whole-body Detection, Recognition and Identification at Altitude and
Range [57.445372305202405]
多様なデータセットに基づいて評価したエンドツーエンドシステムを提案する。
我々のアプローチでは、一般的な画像データセットで検出器を事前トレーニングし、BRIARの複雑なビデオや画像でそれを微調整する。
屋内・屋外・航空シナリオにおける様々な範囲や角度の異なる条件下で徹底的な評価を行う。
論文 参考訳(メタデータ) (2023-11-09T20:20:23Z) - EasyPortrait -- Face Parsing and Portrait Segmentation Dataset [79.16635054977068]
リアルタイムの背景除去や顔の美化といったコンピュータビジョンベースの機能を実現することで,ビデオ会議アプリが機能的になった。
これらのタスクを同時に行うために、新しいデータセット、EasyPortraitを作成します。
13,705人のユニークなユーザーと9つのクラスに分かれたきめ細かいセグメンテーションマスクを備えた、ビデオ会議のシナリオを繰り返す4万枚の屋内写真が含まれている。
論文 参考訳(メタデータ) (2023-04-26T12:51:34Z) - Multiface: A Dataset for Neural Face Rendering [108.44505415073579]
本研究では,新しいマルチビュー,高解像度のヒューマン・フェイス・データセットであるMultifaceを提案する。
顔のパフォーマンスの高解像度同期映像をキャプチャする大規模なマルチカメラ装置であるMugsyを紹介する。
Multifaceの目的は、学術コミュニティにおける高品質データへのアクセシビリティのギャップを埋め、VRテレプレゼンスの研究を可能にすることである。
論文 参考訳(メタデータ) (2022-07-22T17:55:39Z) - LFW-Beautified: A Dataset of Face Images with Beautification and
Augmented Reality Filters [53.180678723280145]
いくつかの操作を含む顔画像のデータベースにコントリビュートする。
画像強調フィルター(コントラストや稲妻を主に修正する)や、動物の鼻や眼鏡などのアイテムを組み込んだ拡張現実フィルターが含まれている。
各データセットには、64×64の4,324枚の画像があり、合計34,592枚の画像がある。
論文 参考訳(メタデータ) (2022-03-11T17:05:10Z) - Facial Masks and Soft-Biometrics: Leveraging Face Recognition CNNs for
Age and Gender Prediction on Mobile Ocular Images [53.913598771836924]
スマートフォンで撮影した自撮り眼画像を使って年齢や性別を推定します。
ImageNet Challengeの文脈で提案された2つの既存の軽量CNNを適応させる。
一部のネットワークは顔認識のためにさらにトレーニングされており、非常に大規模なトレーニングデータベースが利用可能です。
論文 参考訳(メタデータ) (2021-03-31T01:48:29Z) - BWCFace: Open-set Face Recognition using Body-worn Camera [0.8594140167290097]
本稿では,ボディウーンカメラ(BWC)を用いた最先端顔認識のギャップを埋めることを目的とする。
本研究のコントリビューションは,1)ボディウーンカメラを用いて撮影した132人の被験者の合計178Kの顔画像からなるBWCFaceと呼ばれるデータセットの収集と,2)最新のディープラーニングベースの畳み込みニューラルネットワーク(CNN)アーキテクチャのオープンセット評価と,5種類の顔識別機能を組み合わせた。
論文 参考訳(メタデータ) (2020-09-24T02:45:29Z) - A Method for Curation of Web-Scraped Face Image Datasets [13.893682217746816]
データセットを集める際には、さまざまな問題が発生する。
何百万もの画像が存在しているため、手作業によるクリーニングは不可能である。
本稿では,顔認識手法をテストするためのクリーンなデータセットを提供することを目標とする半自動手法を提案する。
論文 参考訳(メタデータ) (2020-04-07T01:57:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。