論文の概要: DeepFace-EMD: Re-ranking Using Patch-wise Earth Mover's Distance
Improves Out-Of-Distribution Face Identification
- arxiv url: http://arxiv.org/abs/2112.04016v1
- Date: Tue, 7 Dec 2021 22:04:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 01:47:09.761885
- Title: DeepFace-EMD: Re-ranking Using Patch-wise Earth Mover's Distance
Improves Out-Of-Distribution Face Identification
- Title(参考訳): deepface-emd:パッチワイズ・アース・ムーバー距離を用いた再ランキングによる分散的顔識別の改善
- Authors: Hai Phan, Anh Nguyen
- Abstract要約: 顔認証(FI)はユビキタスであり、法執行機関による多くの高い判断を導いている。
State-of-the-art FIアプローチは、イメージ埋め込み間のコサイン類似性を採って、2つの画像を比較する。
そこで本稿では, 画像パッチの深部空間的特徴に対するEarth Mover's Distanceを用いて, 2つの顔を比較した再分類手法を提案する。
- 参考スコア(独自算出の注目度): 19.20353547123292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face identification (FI) is ubiquitous and drives many high-stake decisions
made by law enforcement. State-of-the-art FI approaches compare two images by
taking the cosine similarity between their image embeddings. Yet, such an
approach suffers from poor out-of-distribution (OOD) generalization to new
types of images (e.g., when a query face is masked, cropped, or rotated) not
included in the training set or the gallery. Here, we propose a re-ranking
approach that compares two faces using the Earth Mover's Distance on the deep,
spatial features of image patches. Our extra comparison stage explicitly
examines image similarity at a fine-grained level (e.g., eyes to eyes) and is
more robust to OOD perturbations and occlusions than traditional FI.
Interestingly, without finetuning feature extractors, our method consistently
improves the accuracy on all tested OOD queries: masked, cropped, rotated, and
adversarial while obtaining similar results on in-distribution images.
- Abstract(参考訳): 顔認証(FI)はユビキタスであり、法執行機関による多くの高い判断を導いている。
State-of-the-art FIアプローチは、イメージ埋め込み間のコサイン類似性を採って、2つの画像を比較する。
しかし、このようなアプローチは、トレーニングセットやギャラリーに含まれない新しいタイプの画像(例えば、クエリフェイスがマスクされたり、カットされたり、回転したりする場合)に対する不適切な分散(ood)一般化に苦しむ。
そこで本稿では,画像パッチの深部空間的特徴について,Earth Mover's Distanceを用いて2つの顔を比較した。
比較段階は,細粒度の画像類似性(例えば目から目まで)を明示的に検討し,従来のfiよりもood摂動や咬合に頑健である。
興味深いことに,提案手法は機能抽出器を使わずに,マスク,トリミング,回転,逆方向のOODクエリの精度を常に向上し,分布内画像でも同様の結果が得られる。
関連論文リスト
- OSDFace: One-Step Diffusion Model for Face Restoration [72.5045389847792]
拡散モデルは、顔の修復において顕著な性能を示した。
顔復元のための新しいワンステップ拡散モデルOSDFaceを提案する。
その結果,OSDFaceは現状のSOTA(State-of-the-art)手法を視覚的品質と定量的指標の両方で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-26T07:07:48Z) - Detecting Near-Duplicate Face Images [11.270856740227327]
我々は,関係を推定するためのグラフ理論アプローチを用いて,画像フィロジニーツリー(IPT)と呼ばれる木のような構造を構築する。
Image Phylogeny Forests (IPFs) と呼ばれるICTのアンサンブルを作成するために、我々の手法をさらに拡張する。
論文 参考訳(メタデータ) (2024-08-14T17:45:13Z) - Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning [71.14084801851381]
変更キャプションは、類似した画像間のセマンティックな変化を簡潔に記述することを目的としている。
既存のほとんどの手法は、それらの違いを直接キャプチャし、エラーを起こしやすい特徴を得るリスクを負う。
本稿では,2つの画像表現の対応するチャネルを関連づけるイントラクタ免疫表現学習ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T13:00:33Z) - Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - DeepFidelity: Perceptual Forgery Fidelity Assessment for Deepfake
Detection [67.3143177137102]
ディープフェイク検出(Deepfake detection)とは、画像やビデオにおいて、人工的に生成された顔や編集された顔を検出すること。
本稿では,実顔と偽顔とを適応的に識別するDeepFidelityという新しいDeepfake検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-07T07:19:45Z) - Fast and Interpretable Face Identification for Out-Of-Distribution Data
Using Vision Transformers [5.987804054392297]
パッチレベルでの2つのイメージをクロスアテンションを用いて比較する2次元視覚変換器(ViT)を提案する。
我々のモデルは、分布外データ上でDeepFace-EMDと同等の精度で動作しますが、推論速度はDeepFace-EMDの2倍以上の速さです。
論文 参考訳(メタデータ) (2023-11-06T00:11:24Z) - Efficient Explainable Face Verification based on Similarity Score
Argument Backpropagation [5.956239490189115]
2つの顔画像が一致したか否かを、与えられた顔認識システムで理解することが重要である。
そこで我々はxSSABを提案する。xSSABは似通ったスコアに基づく議論をバックプロパゲートする手法で、顔のマッチング決定を支持したり、反対したりする。
Patch-LFWは、新しい評価プロトコルと併用可能な、説明可能な顔検証ベンチマークである。
論文 参考訳(メタデータ) (2023-04-26T09:48:48Z) - Deepfake Detection of Occluded Images Using a Patch-based Approach [1.6114012813668928]
本研究では, 顔全体と顔のパッチを用いて, 障害物の有無で実像と偽像を識別する深層学習手法を提案する。
偽画像を作成するには、FFHQイメージでStyleGANとStyleGAN2を、CelebAイメージでStarGANとPGGANをトレーニングする。
提案手法は他の手法よりも早期に高い結果に到達し、異なる構築されたデータセットにおいてSoTAの結果を0.4%-7.9%向上させる。
論文 参考訳(メタデータ) (2023-04-10T12:12:14Z) - Manifold-Inspired Single Image Interpolation [17.304301226838614]
単画像への多くのアプローチは半局所類似性を利用するために多様体モデルを使用する。
入力画像のエイリアス化は どちらの部分も困難です
本稿では,重度のエイリアス領域におけるエイリアス除去のための適応手法を提案する。
この技術は、強いエイリアスが存在する場合でも、類似したパッチを確実に識別することができる。
論文 参考訳(メタデータ) (2021-07-31T04:29:05Z) - DeepFake Detection Based on the Discrepancy Between the Face and its
Context [94.47879216590813]
単一画像における顔のスワップやその他のアイデンティティ操作を検出する手法を提案する。
提案手法は, (i) 厳密なセマンティックセグメンテーションによって境界付けられた顔領域を考慮した顔識別ネットワークと, (ii) 顔コンテキストを考慮したコンテキスト認識ネットワークの2つのネットワークを含む。
本稿では,2つのネットワークからの認識信号を用いて,そのような不一致を検出する手法について述べる。
提案手法は,FaceForensics++,Celeb-DF-v2,DFDCベンチマークを用いて顔検出を行い,未知の手法で生成した偽物の検出を一般化する。
論文 参考訳(メタデータ) (2020-08-27T17:04:46Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。