論文の概要: Using Synthetic Images To Uncover Population Biases In Facial Landmarks
Detection
- arxiv url: http://arxiv.org/abs/2111.01683v1
- Date: Mon, 1 Nov 2021 15:42:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 12:41:01.230650
- Title: Using Synthetic Images To Uncover Population Biases In Facial Landmarks
Detection
- Title(参考訳): 顔のランドマーク検出における合成画像による人口バイアスの発見
- Authors: Ran Shadmi, Jonathan Laserson, Gil Elbaz
- Abstract要約: 合成テストセットは,モデルの弱点を効率的に検出し,量や多様性の観点から実際のテストセットの限界を克服できることを示す。
このことは、合成テストセットがモデルの弱点を効率的に検出し、量や多様性の観点から実際のテストセットの限界を克服できることを示している。
- 参考スコア(独自算出の注目度): 0.8594140167290096
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In order to analyze a trained model performance and identify its weak spots,
one has to set aside a portion of the data for testing. The test set has to be
large enough to detect statistically significant biases with respect to all the
relevant sub-groups in the target population. This requirement may be difficult
to satisfy, especially in data-hungry applications. We propose to overcome this
difficulty by generating synthetic test set. We use the face landmarks
detection task to validate our proposal by showing that all the biases observed
on real datasets are also seen on a carefully designed synthetic dataset. This
shows that synthetic test sets can efficiently detect a model's weak spots and
overcome limitations of real test set in terms of quantity and/or diversity.
- Abstract(参考訳): トレーニングされたモデルのパフォーマンスを分析して弱点を特定するには、テスト用のデータの一部を脇に置いておく必要がある。
テストセットは、ターゲット集団のすべての関連するサブグループに対して統計的に重要なバイアスを検出するのに十分な大きさでなければならない。
この要件は、特にデータ格納型アプリケーションでは、満足しにくい場合があります。
合成テストセットを生成することで,この問題を克服することを提案する。
我々は、顔のランドマーク検出タスクを使用して、実際のデータセットで観察されるすべてのバイアスが、慎重に設計された合成データセットで見られることを示し、提案を検証する。
これは、合成テストセットがモデルの弱点を効率的に検出し、量や多様性の観点から実テストセットの限界を克服できることを示している。
関連論文リスト
- A Simple Remedy for Dataset Bias via Self-Influence: A Mislabeled Sample Perspective [33.78421391776591]
本稿では,誤ラベル検出の新たな視点を提案する。
我々の新しい視点は、検出の精度を高め、バイアスのあるモデルを効果的に修正できることを示します。
提案手法は既存の手法を補完するものであり,近年のデバイアス化手法をすでに適用しているモデルに適用しても,性能改善を示す。
論文 参考訳(メタデータ) (2024-11-01T04:54:32Z) - Investigating the Impact of Hard Samples on Accuracy Reveals In-class Data Imbalance [4.291589126905706]
AutoMLドメインでは、モデルの有効性を評価するための重要な指標として、テスト精度が宣言される。
しかし、主性能指標としての試験精度の信頼性は疑問視されている。
トレーニングセットとテストセット間のハードサンプルの分布は、これらのセットの難易度に影響を与える。
本稿では,ハードサンプル識別法を比較するためのベンチマーク手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T11:38:14Z) - Cross-Database Liveness Detection: Insights from Comparative Biometric
Analysis [20.821562115822182]
生検は生検と生検を区別する能力である。
本研究は, 生活度検出モデルの総合的な評価を行う。
私たちの研究は、バイオメトリックセキュリティの進化するリズムをナビゲートするための青写真を提供しています。
論文 参考訳(メタデータ) (2024-01-29T15:32:18Z) - Image change detection with only a few samples [7.5780621370948635]
画像変化検出タスクの最大の障害は、さまざまな場面をカバーする大きな注釈付きデータセットの欠如である。
本稿では,合成データを生成するための単純な画像処理手法を提案する。
次に、対象検出に基づく初期の融合ネットワークを設計し、シアムニューラルネットを上回ります。
論文 参考訳(メタデータ) (2023-11-07T07:01:35Z) - Can You Rely on Your Model Evaluation? Improving Model Evaluation with
Synthetic Test Data [75.20035991513564]
本稿では,モデル評価を容易にする深層生成モデリングフレームワークである3Sテストを紹介する。
私たちの実験では、3Sテストが従来のベースラインより優れていることが示されています。
これらの結果は、限られた実テストデータから合成テストデータへのパラダイムシフトが必要かどうかという問題を提起する。
論文 参考訳(メタデータ) (2023-10-25T10:18:44Z) - Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。
この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。
制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文 参考訳(メタデータ) (2023-04-12T10:29:42Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。
また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文 参考訳(メタデータ) (2022-04-06T06:39:40Z) - Semi-supervised Salient Object Detection with Effective Confidence
Estimation [35.0990691497574]
本研究では,少数のラベル付きサンプルと多数のラベル付きサンプルにアクセス可能な半教師付きサルエント物体検出法について検討した。
本研究では,条件付きエネルギーベースモデルの潜伏変数を用いて,人体給与ラベルの性質をモデル化する。
ラベル付きサンプルは1/16に過ぎず,最先端の完全教師付きモデルと比較して競争性能が向上する。
論文 参考訳(メタデータ) (2021-12-28T07:14:48Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。