論文の概要: Asymmetric Face Recognition with Cross Model Compatible Ensembles
- arxiv url: http://arxiv.org/abs/2303.17531v1
- Date: Thu, 30 Mar 2023 16:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 12:42:38.823391
- Title: Asymmetric Face Recognition with Cross Model Compatible Ensembles
- Title(参考訳): クロスモデル対応アンサンブルを用いた非対称顔認識
- Authors: Ori Linial, Alon Shoshan, Nadav Bhonker, Elad Hirsch, Lior Zamir, Igor
Kviatkovsky, Gerard Medioni
- Abstract要約: 非対称検索は リソース制約による顔認識に 適している
この設定では、ギャラリーのインデックス付けに大規模なモデルを使用し、クエリには軽量モデルを使用する。
本稿では, 知識蒸留に頼るのではなく, 埋め込み変換モデルを用いるアプローチを提案する。
- 参考スコア(独自算出の注目度): 4.002298833349517
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The asymmetrical retrieval setting is a well suited solution for resource
constrained face recognition. In this setting a large model is used for
indexing the gallery while a lightweight model is used for querying. The key
principle in such systems is ensuring that both models share the same embedding
space. Most methods in this domain are based on knowledge distillation. While
useful, they suffer from several drawbacks: they are upper-bounded by the
performance of the single best model found and cannot be extended to use an
ensemble of models in a straightforward manner. In this paper we present an
approach that does not rely on knowledge distillation, rather it utilizes
embedding transformation models. This allows the use of N independently trained
and diverse gallery models (e.g., trained on different datasets or having a
different architecture) and a single query model. As a result, we improve the
overall accuracy beyond that of any single model while maintaining a low
computational budget for querying. Additionally, we propose a gallery image
rejection method that utilizes the diversity between multiple transformed
embeddings to estimate the uncertainty of gallery images.
- Abstract(参考訳): 非対称検索設定は、リソース制約付き顔認識に適したソリューションである。
この設定では、ギャラリーのインデックス付けに大規模なモデルを使用し、クエリには軽量モデルを使用する。
このようなシステムの鍵となる原則は、両方のモデルが同じ埋め込み空間を共有することを保証することである。
この領域のほとんどの方法は知識蒸留に基づいている。
有用ではあるが、いくつかの欠点に苦しむ: それらは1つの最良のモデルのパフォーマンスによって上限に達し、簡単な方法でモデルのアンサンブルを使用するように拡張できない。
本稿では, 組込み変換モデルを利用するのではなく, 知識蒸留に依存しないアプローチを提案する。
これにより、n個の独立したトレーニングと多様なギャラリーモデル(例えば、異なるデータセットでトレーニングされたり、異なるアーキテクチャを持つ)と単一のクエリモデルの使用が可能になる。
その結果,クエリの計算予算を低く保ちながら,どのモデルよりも全体的な精度を向上させることができた。
さらに,複数変換埋め込み間の多様性を利用してギャラリー画像の不確実性を推定するギャラリー画像拒絶手法を提案する。
関連論文リスト
- A Simple Approach to Unifying Diffusion-based Conditional Generation [63.389616350290595]
多様な条件生成タスクを処理するための、シンプルで統一されたフレームワークを導入します。
提案手法は,異なる推論時間サンプリング方式による多目的化を実現する。
我々のモデルは、非親密なアライメントや粗い条件付けのような追加機能をサポートしています。
論文 参考訳(メタデータ) (2024-10-15T09:41:43Z) - AMES: Asymmetric and Memory-Efficient Similarity Estimation for Instance-level Retrieval [14.009257997448634]
本研究は,メモリ効率の制約を考慮に入れたインスタンスレベルの画像検索の問題について検討する。
提案モデルは、画像と画像の類似性を推定するために設計されたトランスフォーマーベースのアーキテクチャを使用する。
標準ベンチマークの結果は、手作りモデルと学習モデルの両方に対するアプローチの優位性を示している。
論文 参考訳(メタデータ) (2024-08-06T16:29:51Z) - Image Similarity using An Ensemble of Context-Sensitive Models [2.9490616593440317]
ラベル付きデータに基づく画像類似性モデルの構築と比較に,より直感的なアプローチを提案する。
画像空間(R,A,B)におけるスパースサンプリングの課題と,文脈に基づくデータを用いたモデルにおけるバイアスに対処する。
実験の結果,構築したアンサンブルモデルは,最高の文脈依存モデルよりも5%高い性能を示した。
論文 参考訳(メタデータ) (2024-01-15T20:23:05Z) - Heterogeneous Federated Learning Using Knowledge Codistillation [23.895665011884102]
本稿では、プール全体における小さなモデルと、より高いキャパシティを持つクライアントのサブセットにおけるより大きなモデルをトレーニングする手法を提案する。
モデルは、パラメータを共有することなく、サーバ上のラベルなしデータセットを利用して、知識蒸留を介して情報を双方向に交換する。
論文 参考訳(メタデータ) (2023-10-04T03:17:26Z) - FastFill: Efficient Compatible Model Update [40.27741553705222]
FastFillは、機能アライメントとポリシーベースの部分的なバックフィルを使用して、互換性のあるモデル更新プロセスである。
過去のバックフィル戦略は性能低下に悩まされており,オンライン部分補充におけるトレーニング目標と注文の重要性が示されている。
論文 参考訳(メタデータ) (2023-03-08T18:03:51Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Meta Internal Learning [88.68276505511922]
単一画像生成のための内部学習は、単一の画像に基づいて新しい画像を生成するようにジェネレータを訓練するフレームワークである。
本稿では,サンプル画像の内部統計をより効果的にモデル化するために,画像集合のトレーニングを可能にするメタラーニング手法を提案する。
以上の結果から, 得られたモデルは, 多数の共通画像アプリケーションにおいて, シングルイメージのGANと同程度に適していることがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:27:38Z) - Compatibility-aware Heterogeneous Visual Search [93.90831195353333]
既存のシステムは、同じ埋め込みモデルを使用して、クエリとギャラリーイメージの表現(埋め込み)を計算します。
1つは埋め込みを計算する各モデルのパラメータを変更し、もう1つは埋め込みを計算するアーキテクチャを変更して実行します。
最大埋め込みモデル(パラゴン)を用いた通常の(均一な)ビジュアルサーチと比較して,CMP-NASは80倍,23倍のコスト削減を実現している。
論文 参考訳(メタデータ) (2021-05-13T02:30:50Z) - Scale-Localized Abstract Reasoning [79.00011351374869]
本稿では,インテリジェンステストとしてよく用いられる抽象的関係推論タスクについて考察する。
いくつかのパターンは空間的有理性を持っているが、他のパターンは意味論に過ぎないため、各クエリを複数の解像度で処理するマルチスケールアーキテクチャを提案する。
異なる解法によって実際に異なるルールが解かれることを示し、組み合わせたマルチスケールアプローチは、全てのベンチマークにおいて、このタスクにおける既存の技術の状態を5~54%上回っていることを示す。
論文 参考訳(メタデータ) (2020-09-20T10:37:29Z) - Diverse Image Generation via Self-Conditioned GANs [56.91974064348137]
手動でアノテートされたクラスラベルを使わずに、クラス条件付きGANモデルを訓練する。
代わりに、我々のモデルは、識別器の特徴空間におけるクラスタリングから自動的に派生したラベルに条件付きである。
我々のクラスタリングステップは、自動的に多様なモードを発見し、それらをカバーするためにジェネレータを明示的に必要とします。
論文 参考訳(メタデータ) (2020-06-18T17:56:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。