論文の概要: Harnessing Unlabeled Data to Improve Generalization of Biometric Gender
and Age Classifiers
- arxiv url: http://arxiv.org/abs/2110.04427v1
- Date: Sat, 9 Oct 2021 01:06:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 14:45:50.483455
- Title: Harnessing Unlabeled Data to Improve Generalization of Biometric Gender
and Age Classifiers
- Title(参考訳): バイオメトリックジェンダーと年齢分類器の一般化のためのラベルなしデータの調和
- Authors: Aakash Varma Nadimpalli, Narsi Reddy, Sreeraj Ramachandran and Ajita
Rattani
- Abstract要約: ディープラーニングモデルは、モデルトレーニングと最適パラメータ推定のために、大量のラベル付きデータを必要とする。
プライバシやセキュリティ上の懸念から、医療分野を含む特定のアプリケーションに対して大量のラベル付きデータを収集することはできない。
本稿では,ラベル付きデータに制限を加えた自己アンサンブルに基づくディープラーニングモデルを提案する。
- 参考スコア(独自算出の注目度): 0.7874708385247353
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With significant advances in deep learning, many computer vision applications
have reached the inflection point. However, these deep learning models need
large amount of labeled data for model training and optimum parameter
estimation. Limited labeled data for model training results in over-fitting and
impacts their generalization performance. However, the collection and
annotation of large amount of data is a very time consuming and expensive
operation. Further, due to privacy and security concerns, the large amount of
labeled data could not be collected for certain applications such as those
involving medical field. Self-training, Co-training, and Self-ensemble methods
are three types of semi-supervised learning methods that can be used to exploit
unlabeled data. In this paper, we propose self-ensemble based deep learning
model that along with limited labeled data, harness unlabeled data for
improving the generalization performance. We evaluated the proposed
self-ensemble based deep-learning model for soft-biometric gender and age
classification. Experimental evaluation on CelebA and VISOB datasets suggest
gender classification accuracy of 94.46% and 81.00%, respectively, using only
1000 labeled samples and remaining 199k samples as unlabeled samples for CelebA
dataset and similarly,1000 labeled samples with remaining 107k samples as
unlabeled samples for VISOB dataset. Comparative evaluation suggest that there
is $5.74\%$ and $8.47\%$ improvement in the accuracy of the self-ensemble model
when compared with supervised model trained on the entire CelebA and VISOB
dataset, respectively. We also evaluated the proposed learning method for
age-group prediction on Adience dataset and it outperformed the baseline
supervised deep-learning learning model with a better exact accuracy of 55.55
$\pm$ 4.28 which is 3.92% more than the baseline.
- Abstract(参考訳): ディープラーニングの進歩により、多くのコンピュータビジョンアプリケーションが屈折点に達している。
しかし、これらのディープラーニングモデルは、モデルトレーニングと最適パラメータ推定のために大量のラベル付きデータを必要とする。
モデルトレーニングのための限定されたラベル付きデータは過剰フィッティングとなり、その一般化性能に影響を及ぼす。
しかし、大量のデータの収集とアノテーションは、非常に時間がかかり、高価な操作である。
さらに、プライバシやセキュリティ上の懸念から、医療分野を含む特定のアプリケーションに対して大量のラベル付きデータを収集することはできない。
自己学習、協調学習、自己アンサンブル法は、ラベルのないデータを活用するために使用できる3種類の半教師付き学習法である。
本稿では,限定ラベルデータとともにラベルなしデータを利用して一般化性能を向上させる自己センブル型ディープラーニングモデルを提案する。
ソフトバイオメトリックジェンダーと年齢分類のための自己アンサンブルに基づく深層学習モデルの評価を行った。
CelebA データセットと VISOB データセットの実験的評価では、それぞれ 94.46% と 81.00% の性別分類精度が示唆されており、CelebA データセットのラベルなしサンプルは 1000 のラベル付きサンプルと残りの 199k のサンプルのみであり、同様に 107k のサンプルが残っていた1000 のラベル付きサンプルは VISOB データセットのラベルなしサンプルである。
比較評価では、celebaデータセットとvisobデータセットでトレーニングされた教師付きモデルと比較して、自己センブルモデルの精度が5.74\%$と8.47\%$改善されていることが示唆される。
また,Adienceデータセット上での年齢群予測のための学習手法も評価し,ベースラインよりも3.92%高い55.55$\pm$4.28の精度でベースライン教師付きディープラーニング学習モデルより優れていた。
関連論文リスト
- A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.35500308126506]
自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。
SSLの分類に基づく評価プロトコルがどのように相関し、異なるデータセットのダウンストリーム性能を予測するかを検討する。
論文 参考訳(メタデータ) (2024-07-16T23:17:36Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Uncertainty-Aware Semi-Supervised Learning for Prostate MRI Zonal
Segmentation [0.9176056742068814]
比較的少数のアノテーションしか必要としない新しい半教師付き学習(SSL)手法を提案する。
提案手法は,近年の深層学習の不確実性推定モデルを用いた擬似ラベル手法を用いる。
提案モデルは,ProstateXデータセットと外部テストセットを用いた実験において,半教師付きモデルよりも優れていた。
論文 参考訳(メタデータ) (2023-05-10T08:50:04Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica [0.5541644538483946]
ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
論文 参考訳(メタデータ) (2021-07-24T22:26:50Z) - Self Training with Ensemble of Teacher Models [8.257085583227695]
堅牢なディープラーニングモデルのトレーニングには,大量のラベル付きデータが必要である。
このようなラベル付きデータの大規模なリポジトリがなければ、ラベルなしのデータも同様に利用することができる。
準スーパービジョン学習は、そのようなラベルのないデータを分類モデルの訓練に活用することを目的としている。
論文 参考訳(メタデータ) (2021-07-17T09:44:09Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Uncertainty-aware Self-training for Text Classification with Few Labels [54.13279574908808]
本研究は,アノテーションのボトルネックを軽減するための半教師あり学習手法の1つとして,自己学習について研究する。
本稿では,基礎となるニューラルネットワークの不確実性推定を取り入れて,自己学習を改善する手法を提案する。
本手法では,クラス毎に20~30個のラベル付きサンプルをトレーニングに利用し,完全教師付き事前学習言語モデルの3%以内で検証を行う。
論文 参考訳(メタデータ) (2020-06-27T08:13:58Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。