論文の概要: Local Sliced-Wasserstein Feature Sets for Illumination-invariant Face
Recognition
- arxiv url: http://arxiv.org/abs/2202.10642v1
- Date: Tue, 22 Feb 2022 03:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 15:36:39.074926
- Title: Local Sliced-Wasserstein Feature Sets for Illumination-invariant Face
Recognition
- Title(参考訳): 局所スライス型wasserstein特徴セットによる照明不変顔の認識
- Authors: Yan Zhuang, Shiying Li, Mohammad Shifat-E-Rabbi, Xuwang Yin, Abu
Hasnat Mohammad Rubaiyat, Gustavo K. Rohde
- Abstract要約: 様々な照明条件下で取得したデジタル画像から顔を認識する新しい手法を提案する。
ラドン累積分布変換を用いた局所勾配分布の数学的モデリングに基づく。
提案手法を実装したPythonコードは,ソフトウェアパッケージPyTransKitの一部として統合されている。
- 参考スコア(独自算出の注目度): 10.435990685398595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new method for face recognition from digital images acquired
under varying illumination conditions. The method is based on mathematical
modeling of local gradient distributions using the Radon Cumulative
Distribution Transform (R-CDT). We demonstrate that lighting variations cause
certain types of deformations of local image gradient distributions which, when
expressed in R-CDT domain, can be modeled as a subspace. Face recognition is
then performed using a nearest subspace in R-CDT domain of local gradient
distributions. Experiment results demonstrate the proposed method outperforms
other alternatives in several face recognition tasks with challenging
illumination conditions. Python code implementing the proposed method is
available, which is integrated as a part of the software package PyTransKit.
- Abstract(参考訳): 様々な照明条件下で取得したデジタル画像から顔を認識する新しい手法を提案する。
この手法は,Randon Cumulative Distribution Transform (R-CDT) を用いた局所勾配分布の数学的モデリングに基づく。
我々は,R-CDT領域で表現された場合,部分空間としてモデル化できる局所像勾配分布の特定の種類の変形を引き起こすことを示す。
次に、局所勾配分布のR-CDT領域に最も近い部分空間を用いて顔認識を行う。
提案手法は,いくつかの認識課題において,照明条件に挑戦する他の手法よりも優れていることを示す。
提案手法を実装したPythonコードは,ソフトウェアパッケージPyTransKitの一部として統合されている。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - Deep Richardson-Lucy Deconvolution for Low-Light Image Deblurring [48.80983873199214]
我々は,飽和画素を学習潜時マップでモデル化するデータ駆動型手法を開発した。
新しいモデルに基づいて、非盲検除色タスクを最大後部(MAP)問題に定式化することができる。
増幅されたアーティファクトを使わずに高品質な劣化画像を推定するために,我々は事前推定ネットワークを構築した。
論文 参考訳(メタデータ) (2023-08-10T12:53:30Z) - $PC^2$: Projection-Conditioned Point Cloud Diffusion for Single-Image 3D
Reconstruction [97.06927852165464]
単一のRGB画像から物体の3次元形状を再構築することは、コンピュータビジョンにおける長年の課題である。
条件付き偏光拡散プロセスによりスパース点雲を生成する単一像3次元再構成法を提案する。
論文 参考訳(メタデータ) (2023-02-21T13:37:07Z) - Difference of Anisotropic and Isotropic TV for Segmentation under Blur
and Poisson Noise [2.6381163133447836]
画像をスムーシング・アンド・スレッディング(SaT)セグメンテーションフレームワークを採用して、スムースなソリューションを見つけ、次に$k-meansで画像のセグメンテーションを行う。
具体的には、画像平滑化ステップにおいて、ムムフォードシャーモデルの最大雑音を正則化として、異方性全変動(AITV)の最大変動に置き換える。
スキームの有効性を検証するための収束解析が提供される。
論文 参考訳(メタデータ) (2023-01-06T01:14:56Z) - Learning Local Implicit Fourier Representation for Image Warping [11.526109213908091]
画像ワーピング(LTEW)のための局所的テクスチャ推定器を提案し,次に暗黙のニューラル表現を用いて画像を連続的な形状に変形する。
我々のLTEWベースのニューラル関数は、非対称スケールSRとホモグラフィ変換の既存のワープ手法よりも優れています。
論文 参考訳(メタデータ) (2022-07-05T06:30:17Z) - Extracting Deformation-Aware Local Features by Learning to Deform [3.364554138758565]
非剛性変形に対して頑健な静止画像から特徴量を計算するための新しい手法を提案する。
我々は、シミュレーション環境でオブジェクトに非剛性変形を適用することにより、モデルアーキテクチャをエンドツーエンドにトレーニングする。
実験により, この手法は, 最新の手工芸画像, 学習ベース画像, およびRGB-Dディスクリプタを異なるデータセットで比較した。
論文 参考訳(メタデータ) (2021-11-20T15:46:33Z) - Raw Bayer Pattern Image Synthesis with Conditional GAN [0.0]
本稿では,GAN(Generative Adversarial Network)によるベイアパターン画像生成手法を提案する。
変換を復調として設定することで、ベイアパターン画像を生成することができる。
実験の結果,提案手法により生成した画像は,FIDスコア,PSNR,SSIMにおいて元のPix2PixHDモデルより優れていた。
論文 参考訳(メタデータ) (2021-10-25T11:40:36Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - High Resolution Face Editing with Masked GAN Latent Code Optimization [0.0]
顔の編集はコンピュータビジョンコミュニティで人気のある研究トピックである。
最近の提案手法は、条件付きエンコーダデコーダであるGAN(Generative Adversarial Network)をエンドツーエンドでトレーニングするか、事前に訓練されたバニラGANジェネレータモデルの潜時空間での動作を定義するかのいずれかである。
空間的および意味的制約を伴ったGAN組み込み最適化手順を提案する。
論文 参考訳(メタデータ) (2021-03-20T08:39:41Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。