論文の概要: DAIL: Dataset-Aware and Invariant Learning for Face Recognition
- arxiv url: http://arxiv.org/abs/2101.05419v1
- Date: Thu, 14 Jan 2021 01:59:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 11:08:01.121104
- Title: DAIL: Dataset-Aware and Invariant Learning for Face Recognition
- Title(参考訳): DAIL:顔認識のためのデータセット認識と不変学習
- Authors: Gaoang Wang, Lin Chen, Tianqiang Liu, Mingwei He, and Jiebo Luo
- Abstract要約: 顔認識の性能向上のためには、通常大規模なトレーニングデータセットが必要である。
2つの大きな問題のために異なるデータセットを自然に組み合わせるのは問題で面倒です。
トレーニング中に異なるデータセットの異なるクラスと同じ人を扱うことは、バックプロパゲーションに影響します。
手動でラベルをクリーニングするには 人的努力が要る 特に何百万もの画像と何千ものIDがある時は
- 参考スコア(独自算出の注目度): 67.4903809903022
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To achieve good performance in face recognition, a large scale training
dataset is usually required. A simple yet effective way to improve recognition
performance is to use a dataset as large as possible by combining multiple
datasets in the training. However, it is problematic and troublesome to naively
combine different datasets due to two major issues. First, the same person can
possibly appear in different datasets, leading to an identity overlapping issue
between different datasets. Naively treating the same person as different
classes in different datasets during training will affect back-propagation and
generate non-representative embeddings. On the other hand, manually cleaning
labels may take formidable human efforts, especially when there are millions of
images and thousands of identities. Second, different datasets are collected in
different situations and thus will lead to different domain distributions.
Naively combining datasets will make it difficult to learn domain invariant
embeddings across different datasets. In this paper, we propose DAIL:
Dataset-Aware and Invariant Learning to resolve the above-mentioned issues. To
solve the first issue of identity overlapping, we propose a dataset-aware loss
for multi-dataset training by reducing the penalty when the same person appears
in multiple datasets. This can be readily achieved with a modified softmax loss
with a dataset-aware term. To solve the second issue, domain adaptation with
gradient reversal layers is employed for dataset invariant learning. The
proposed approach not only achieves state-of-the-art results on several
commonly used face recognition validation sets, including LFW, CFP-FP, and
AgeDB-30, but also shows great benefit for practical use.
- Abstract(参考訳): 顔認識の性能向上のためには、通常大規模なトレーニングデータセットが必要である。
認識性能を改善するためのシンプルで効果的な方法は、トレーニングで複数のデータセットを組み合わせることで、可能な限り大きなデータセットを使用することである。
しかし、2つの大きな問題により、異なるデータセットをナイーブに結合するのは問題であり、面倒です。
まず、同じ人物が異なるデータセットに現れる可能性があり、異なるデータセット間でアイデンティティが重複する問題が発生する。
トレーニング中に異なるデータセットで同じ人を異なるクラスとして扱い、バックプロパゲーションに影響を与え、非表現埋め込みを生成する。
一方、手動でラベルをクリーニングする作業は、特に何百万もの画像と何千ものアイデンティティがある場合、人的努力を要する可能性がある。
第2に、異なるデータセットが異なる状況で収集されるため、異なるドメイン分布が生まれる。
データセットを組み合わせることで、さまざまなデータセットにまたがるドメイン不変の埋め込みを学ぶのが難しくなる。
本稿では、上記の課題を解決するために、dail: dataset-aware and invariant learningを提案する。
本稿では,同一人物が複数データセットに出現した場合のペナルティを低減し,複数データセットのトレーニングにおけるデータセット認識損失を解消する。
これはデータセット認識項による修正ソフトマックス損失で容易に達成できる。
第2の問題を解決するために、データセット不変学習に勾配反転層を用いた領域適応を用いる。
提案手法は,lfw,cfp-fp,agesb-30などの顔認証セットにおいて最先端の結果を得るだけでなく,実用化にも大きなメリットがある。
関連論文リスト
- What is different between these datasets? [23.271594219577185]
同じドメイン内の2つの同等のデータセットは、異なる分布を持つ可能性がある。
本稿では,2つのデータセットを比較するための解釈可能な手法(ツールボックス)を提案する。
我々の手法は、説明品質と正確性の観点から比較および関連するアプローチよりも優れているだけでなく、データセットの違いを効果的に理解し軽減するための実用的な補完的な洞察を提供する。
論文 参考訳(メタデータ) (2024-03-08T19:52:39Z) - Combining datasets to increase the number of samples and improve model
fitting [7.4771091238795595]
我々はImp(ComImp)に基づくコンバインドデータセットと呼ばれる新しいフレームワークを提案する。
さらに,PCA,PCA-ComImpを用いたComImpの変種を提案する。
提案手法は,より小さなデータセット上での予測モデルの精度を大幅に向上させることで,転送学習と幾らか類似していることが示唆された。
論文 参考訳(メタデータ) (2022-10-11T06:06:37Z) - AdaptCL: Adaptive Continual Learning for Tackling Heterogeneity in
Sequential Datasets [13.065880037738108]
AdaptCLは、異種データセットに取り組むための新しい適応型連続学習手法である。
データ複雑性とデータセットサイズの変化に対応するために、きめ細かいデータ駆動プルーニングを採用している。
また、タスクに依存しないパラメータ分離を利用して、破滅的な忘れ方の影響を緩和する。
論文 参考訳(メタデータ) (2022-07-22T10:48:06Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Learning Semantic Segmentation from Multiple Datasets with Label Shifts [101.24334184653355]
本論文では,ラベル空間が異なる複数のデータセットを対象としたモデルの自動学習手法であるUniSegを提案する。
具体的には,ラベルの相反と共起を考慮に入れた2つの損失を提案する。
論文 参考訳(メタデータ) (2022-02-28T18:55:19Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Multi-domain semantic segmentation with overlapping labels [1.4120796122384087]
本稿では,部分ラベルと確率的損失に基づいて重なり合うクラスを持つデータセットをシームレスに学習する手法を提案する。
本手法は,トレーニングデータセットに別々にラベル付けされていない視覚概念を学習すると同時に,競合するデータセット内およびクロスデータセットの一般化を実現する。
論文 参考訳(メタデータ) (2021-08-25T13:25:41Z) - Unsupervised Pre-training for Person Re-identification [90.98552221699508]
大規模無ラベル人物再識別(Re-ID)データセットLUPersonを提案する。
学習者のRe-ID特徴表現の一般化能力を向上させるために,教師なし事前学習を初めて行おうとする。
論文 参考訳(メタデータ) (2020-12-07T14:48:26Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。