論文の概要: New Benchmarks for Asian Facial Recognition Tasks: Face Classification
with Large Foundation Models
- arxiv url: http://arxiv.org/abs/2310.09756v1
- Date: Sun, 15 Oct 2023 06:51:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 18:20:16.866485
- Title: New Benchmarks for Asian Facial Recognition Tasks: Face Classification
with Large Foundation Models
- Title(参考訳): アジアの顔認識タスクの新しいベンチマーク:大規模基礎モデルによる顔分類
- Authors: Jinwoo Seo, Soora Choi, Eungyeom Ha, Beomjune Kim, Dongbin Na
- Abstract要約: 本稿では,KoInという韓国の大規模インフルエンサーデータセットを提案する。
提案データセットのほとんどの画像は、Instagramのようなソーシャルネットワークサービス(SNS)から収集されている。
本誌のデータセットKoInには、100あまりの韓国の有名人の写真10万枚が載っている。
- 参考スコア(独自算出の注目度): 3.437372707846067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The face classification system is an important tool for recognizing personal
identity properly. This paper introduces a new Large-Scale Korean Influencer
Dataset named KoIn. Our presented dataset contains many real-world photos of
Korean celebrities in various environments that might contain stage lighting,
backup dancers, and background objects. These various images can be useful for
training classification models classifying K-influencers. Most of the images in
our proposed dataset have been collected from social network services (SNS)
such as Instagram. Our dataset, KoIn, contains over 100,000 K-influencer photos
from over 100 Korean celebrity classes. Moreover, our dataset provides
additional hard case samples such as images including human faces with masks
and hats. We note that the hard case samples are greatly useful in evaluating
the robustness of the classification systems. We have extensively conducted
several experiments utilizing various classification models to validate the
effectiveness of our proposed dataset. Specifically, we demonstrate that recent
state-of-the-art (SOTA) foundation architectures show decent classification
performance when trained on our proposed dataset. In this paper, we also
analyze the robustness performance against hard case samples of large-scale
foundation models when we fine-tune the foundation models on the normal cases
of the proposed dataset, KoIn. Our presented dataset and codes will be publicly
available at https://github.com/dukong1/KoIn_Benchmark_Dataset.
- Abstract(参考訳): 顔分類システムは、個人識別を適切に認識するための重要なツールである。
本稿では,KoInという韓国の大規模インフルエンサーデータセットを紹介する。
提案データセットには、舞台照明、バックアップダンサー、背景オブジェクトを含む様々な環境で、韓国の有名人の現実の写真が多数含まれています。
これらの画像はk-インフルエンサーを分類する分類モデルの訓練に有用である。
提案データセットのほとんどの画像は、Instagramのようなソーシャルネットワークサービス(SNS)から収集されている。
本誌のデータセットKoInには、100あまりの韓国の有名人の写真10万枚が載っている。
さらに当社のデータセットでは,マスクや帽子を備えた人間の顔を含む画像など,追加のハードケースサンプルも提供しています。
ハードケースサンプルは分類システムのロバスト性を評価するのに非常に有用である。
提案したデータセットの有効性を検証するために,様々な分類モデルを用いた実験を幅広く行った。
具体的には、最近のSOTA(State-of-the-art)基盤アーキテクチャは、提案したデータセットでトレーニングした場合、適切な分類性能を示す。
本稿では,提案するデータセットKoInの通常事例に基礎モデルを微調整した場合の大規模基盤モデルのハードケースサンプルに対するロバスト性性能を解析する。
提示されたデータセットとコードはhttps://github.com/dukong1/KoIn_Benchmark_Dataset.comで公開されます。
関連論文リスト
- DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - Evaluating Data Attribution for Text-to-Image Models [62.844382063780365]
我々は,既存の大規模モデルを与えられた模範オブジェクトやスタイルにチューニングする「カストミゼーション」手法による属性評価を行う。
私たちのキーとなる洞察は、これによって、構築によって模範にコンピュータ的に影響される合成画像を効率的に作成できるということです。
問題の本質的な不確実性を考慮することで、一連のトレーニング画像に対してソフトな属性スコアを割り当てることができる。
論文 参考訳(メタデータ) (2023-06-15T17:59:51Z) - Information Gain Sampling for Active Learning in Medical Image
Classification [3.1619162190378787]
本研究は,ラベル付け対象プールからの最適な画像選択を誘導する情報理論のアクティブラーニングフレームワークを提案する。
2つの異なる医用画像分類データセットで実験を行う。
論文 参考訳(メタデータ) (2022-08-01T16:25:53Z) - Learning from few examples: Classifying sex from retinal images via deep
learning [3.9146761527401424]
基礎画像から患者の性別を分類するために,小データセット上でのDLの性能について紹介する。
約2500基の画像を用いて開発した本モデルでは,最大0.72点のAUCスコアが得られた。
これは、データセットサイズが1000倍近く減少しているにもかかわらず、わずか25%のパフォーマンス低下に相当する。
論文 参考訳(メタデータ) (2022-07-20T02:47:29Z) - Vision Models Are More Robust And Fair When Pretrained On Uncurated
Images Without Supervision [38.22842778742829]
差別的な自己教師型学習は、インターネット画像の任意のランダムなグループでのトレーニングモデルを可能にする。
データ前処理や事前の仮定なしで、何十億ものランダムなイメージでモデルをトレーニングします。
フェアネス、分布シフト、地理的多様性、微粒化認識、画像コピー検出、および多くの画像分類データセットを含む50以上のベンチマークにおいて、我々のモデル性能を広範囲に研究し、検証した。
論文 参考訳(メタデータ) (2022-02-16T22:26:47Z) - Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。
我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文 参考訳(メタデータ) (2021-08-04T14:51:37Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。