論文の概要: CoNAN: Conditional Neural Aggregation Network For Unconstrained Face
Feature Fusion
- arxiv url: http://arxiv.org/abs/2307.10237v1
- Date: Sun, 16 Jul 2023 09:47:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 16:37:38.600296
- Title: CoNAN: Conditional Neural Aggregation Network For Unconstrained Face
Feature Fusion
- Title(参考訳): conan: unconstrained face feature fusionのための条件付きニューラルネットワーク
- Authors: Bhavin Jawade, Deen Dayal Mohan, Dennis Fedorishin, Srirangaraj
Setlur, Venu Govindaraju
- Abstract要約: テンプレートアグリゲーションのためのCoNANと呼ばれる特徴分散条件付け手法を提案する。
具体的には,受信した特徴集合の分布情報から条件付きコンテキストベクトルを学習することを目的としている。
提案手法は、長距離非拘束顔認識データセットの最先端結果を生成する。
- 参考スコア(独自算出の注目度): 11.059590443280726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face recognition from image sets acquired under unregulated and uncontrolled
settings, such as at large distances, low resolutions, varying viewpoints,
illumination, pose, and atmospheric conditions, is challenging. Face feature
aggregation, which involves aggregating a set of N feature representations
present in a template into a single global representation, plays a pivotal role
in such recognition systems. Existing works in traditional face feature
aggregation either utilize metadata or high-dimensional intermediate feature
representations to estimate feature quality for aggregation. However,
generating high-quality metadata or style information is not feasible for
extremely low-resolution faces captured in long-range and high altitude
settings. To overcome these limitations, we propose a feature distribution
conditioning approach called CoNAN for template aggregation. Specifically, our
method aims to learn a context vector conditioned over the distribution
information of the incoming feature set, which is utilized to weigh the
features based on their estimated informativeness. The proposed method produces
state-of-the-art results on long-range unconstrained face recognition datasets
such as BTS, and DroneSURF, validating the advantages of such an aggregation
strategy.
- Abstract(参考訳): 遠距離、低解像度、様々な視点、照明、ポーズ、大気条件など、制御されていない条件下で取得された画像集合からの顔認識は困難である。
テンプレートに存在するn個の特徴表現を単一のグローバル表現に集約することを含む顔特徴集約は、そのような認識システムにおいて重要な役割を果たす。
従来の顔特徴集約における既存の仕事は、メタデータまたは高次元の中間特徴表現を使用して、アグリゲーションの特徴品質を推定する。
しかし、高品質なメタデータやスタイル情報を生成することは、長距離や高高度で捉えた極めて低解像度の顔では不可能である。
このような制約を克服するために,テンプレートアグリゲーションのためのCoNANと呼ばれる特徴分散条件付け手法を提案する。
具体的には,受信した特徴集合の分布情報に基づいて条件付きコンテキストベクトルを学習し,その推定情報量に基づいて特徴量を測定することを目的とする。
提案手法は,btsやdronesurfなどの長期非拘束型顔認識データセットに最先端の結果を与え,そのような集約戦略の利点を検証する。
関連論文リスト
- High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
SDモデルに先立って、頑健な一般化機能とリッチで多目的な画像表現を活用することにより、高忠実で詳細な生成を保ちながら、推論時間を著しく短縮する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-10-14T02:49:23Z) - Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - Trading-off Mutual Information on Feature Aggregation for Face
Recognition [12.803514943105657]
本稿では、2つの最先端(SOTA)深層顔認識(FR)モデルの出力を集約する手法を提案する。
提案手法では,2つの特徴写像の異なる部分間の関係を利用するために,変圧器の注意機構を利用する。
提案手法の有効性を評価するため,一般的なベンチマーク実験を行い,その結果を最先端のアルゴリズムと比較した。
論文 参考訳(メタデータ) (2023-09-22T18:48:38Z) - SSMG: Spatial-Semantic Map Guided Diffusion Model for Free-form
Layout-to-Image Generation [68.42476385214785]
本稿では,レイアウトから派生した特徴写像を用いた空間意味マップガイド(SSMG)拡散モデルを提案する。
SSMGは,従来の研究に比べて空間的,意味的な制御性に優れた生成品質を実現する。
また,RSA(Relation-Sensitive Attention)機構とLSA(Location-Sensitive Attention)機構を提案する。
論文 参考訳(メタデータ) (2023-08-20T04:09:12Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - ShaRP: Shape-Regularized Multidimensional Projections [71.30697308446064]
本稿では,生成した散布板の視覚的シグネチャをユーザが明示的に制御できる新しいプロジェクション技術,ShaRPを提案する。
ShaRPは次元とデータセットサイズによく対応し、任意の定量的データセットを汎用的に処理する。
論文 参考訳(メタデータ) (2023-06-01T11:16:58Z) - DuAT: Dual-Aggregation Transformer Network for Medical Image
Segmentation [21.717520350930705]
トランスフォーマーベースのモデルはコンピュータビジョンタスクで成功することが広く実証されている。
しかし、それらはしばしば大きなパターンの特徴によって支配され、局所的な詳細が失われる。
本稿では、2つの革新的な設計を特徴とするDuATと呼ばれるDual-Aggregation Transformer Networkを提案する。
大腸内視鏡画像における皮膚病変像とポリープの分画における最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-12-21T07:54:02Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Multi-Person Pose Estimation with Enhanced Feature Aggregation and
Selection [33.15192824888279]
複数人物のポーズ推定のためのEFASNet(Enhanced Feature Aggregation and Selection Network)を提案する。
我々の手法は、混み合った、散らばった、ぎこちないシーンをうまく扱える。
総合的な実験により、提案手法は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-20T08:33:25Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。