論文の概要: CRFace: Confidence Ranker for Model-Agnostic Face Detection Refinement
- arxiv url: http://arxiv.org/abs/2103.07017v1
- Date: Fri, 12 Mar 2021 00:50:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-15 13:24:26.424067
- Title: CRFace: Confidence Ranker for Model-Agnostic Face Detection Refinement
- Title(参考訳): CRFace:モデル診断顔検出リファインメントのための信頼ランキング
- Authors: Noranart Vesdapunt, Baoyuan Wang
- Abstract要約: 最近のスマートフォンは8k解像度でビデオを撮影できるが、既存の顔検出装置の多くはアンカーサイズとトレーニングデータのために失敗している。
故障事例を解析し,不正確な信頼度で多数の予測ボックスを観測する。
同一画像内で予測された信頼度を局所的に再ランクするペアワイズランキング損失を有する信頼度ランキングネットワークを提案する。
- 参考スコア(独自算出の注目度): 23.0672482272601
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face detection is a fundamental problem for many downstream face
applications, and there is a rising demand for faster, more accurate yet
support for higher resolution face detectors. Recent smartphones can record a
video in 8K resolution, but many of the existing face detectors still fail due
to the anchor size and training data. We analyze the failure cases and observe
a large number of correct predicted boxes with incorrect confidences. To
calibrate these confidences, we propose a confidence ranking network with a
pairwise ranking loss to re-rank the predicted confidences locally within the
same image. Our confidence ranker is model-agnostic, so we can augment the data
by choosing the pairs from multiple face detectors during the training, and
generalize to a wide range of face detectors during the testing. On WiderFace,
we achieve the highest AP on the single-scale, and our AP is competitive with
the previous multi-scale methods while being significantly faster. On 8K
resolution, our method solves the GPU memory issue and allows us to indirectly
train on 8K. We collect 8K resolution test set to show the improvement, and we
will release our test set as a new benchmark for future research.
- Abstract(参考訳): 顔検出は多くの下流のアプリケーションにとって根本的な問題であり、より速く、より正確に、より高解像度な顔検出のサポートに対する需要が高まっている。
最近のスマートフォンは8k解像度でビデオを撮影できるが、既存の顔検出装置の多くはアンカーサイズとトレーニングデータのために失敗している。
故障事例を解析し,不正確な信頼度で多数の予測ボックスを観測する。
本研究では,これらの信頼度を測定するために,同一画像内で予測される信頼度を局所的に再ランクするペアワイズランキング損失を持つ信頼度ランキングネットワークを提案する。
当社の信頼ランキングはモデルに依存しないため、トレーニング中に複数の顔検出器からペアを選択し、テスト中に幅広い顔検出器に一般化することでデータを強化できます。
WiderFaceでは、単一スケールで最高のAPを達成することができ、我々のAPは従来のマルチスケールメソッドと競合すると同時に、はるかに高速である。
8k解像度では、gpuメモリの問題を解決し、8k上で間接的にトレーニングできる。
改善を示すために8K解像度テストセットを収集し、将来の研究のための新しいベンチマークとしてテストセットをリリースします。
関連論文リスト
- Herd Mentality in Augmentation -- Not a Good Idea! A Robust Multi-stage Approach towards Deepfake Detection [0.0]
ディープフェイク技術はデジタルメディアの整合性に大きな懸念を引き起こしている。
ほとんどの標準的な画像分類器は、偽の顔と実の顔の区別に失敗した。
我々は、重み付き損失と更新拡張技術を組み合わせたGenConViTモデルに基づく拡張アーキテクチャを提案する。
このモデルでは、F1スコアが1.71%向上し、Celeb-DF v2データセットの精度が4.34%向上した。
論文 参考訳(メタデータ) (2024-10-07T19:51:46Z) - Exploring Decision-based Black-box Attacks on Face Forgery Detection [53.181920529225906]
顔の偽造生成技術は鮮明な顔を生み出し、セキュリティとプライバシーに対する世間の懸念を高めている。
顔偽造検出は偽の顔の識別に成功しているが、最近の研究では顔偽造検出は敵の例に対して非常に脆弱であることが示されている。
論文 参考訳(メタデータ) (2023-10-18T14:49:54Z) - SqueezerFaceNet: Reducing a Small Face Recognition CNN Even More Via
Filter Pruning [55.84746218227712]
我々は,100万パラメータ未満の軽量顔認識ネットワークであるSqueezerFaceNetを開発した。
性能を損なうことなく、さらに(最大40%)削減できることを示す。
論文 参考訳(メタデータ) (2023-07-20T08:38:50Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - A new face swap method for image and video domains: a technical report [60.47144478048589]
FaceShifterアーキテクチャに基づいた新しいフェイススワップパイプラインを導入する。
新しいアイロス機能、超解像ブロック、ガウスベースのフェイスマスク生成は、品質改善につながる。
論文 参考訳(メタデータ) (2022-02-07T10:15:50Z) - Is RobustBench/AutoAttack a suitable Benchmark for Adversarial
Robustness? [20.660465258314314]
我々は, AutoAttack による l-inf, eps = 8/255 によるデータ交換が非現実的に強く, 対向サンプルの完全検出率に近いことを論じる。
また、同様の成功率を達成しながら、他の攻撃方法を検出するのがずっと難しいことも示している。
論文 参考訳(メタデータ) (2021-12-02T20:44:16Z) - FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。
提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。
Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文 参考訳(メタデータ) (2021-08-27T03:07:55Z) - Selfie Periocular Verification using an Efficient Super-Resolution
Approach [11.352465961204775]
超解像度は、キャプチャされた画像の品質を高めるために使われる必要がある。
最先端のスーパーリゾリューションメソッドのほとんどは、大規模なフィルタを備えたディープネットワークを使用します。
本研究では,深層ニューラルネットワークの効率とフィルタのサイズとのトレードオフを考慮した,効率的なesisr(single image super- resolution)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-16T21:01:12Z) - Video Face Recognition System: RetinaFace-mnet-faster and Secondary
Search [5.371825910267909]
本稿は、主にビデオの複雑な顔について実験する。
ファジィシーンや露出の少ない顔のための画像前処理モジュールを設計し、画像を強化する。
また,検出のためのRetinacFace-mnet-fasterと顔認識のための信頼しきい値仕様を提案する。
論文 参考訳(メタデータ) (2020-09-28T09:31:38Z) - DeepMark++: Real-time Clothing Detection at the Edge [55.41644538483948]
本稿では,迅速な衣服検出とキーポイント推定を実現するための単一ステージアプローチを提案する。
提案手法は,マルチターゲットネットワークであるCenterNetをベースとして,性能向上のためのポストプロセッシング技術をいくつか導入する。
私たちの最も正確なモデルは、DeepFashion2データセットの最先端ソリューションに匹敵する結果を達成します。
論文 参考訳(メタデータ) (2020-06-01T04:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。