論文の概要: Weakly Supervised Face and Whole Body Recognition in Turbulent
Environments
- arxiv url: http://arxiv.org/abs/2308.11757v1
- Date: Tue, 22 Aug 2023 19:58:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 17:00:49.971164
- Title: Weakly Supervised Face and Whole Body Recognition in Turbulent
Environments
- Title(参考訳): 乱流環境における弱教師付き顔と全身認識
- Authors: Kshitij Nikhal, Benjamin S. Riggan
- Abstract要約: 本稿では, 領域表現を生成し, 乱流像と原始像を共通部分空間に整列する, 弱教師付きフレームワークを提案する。
また、乱流画像で観測される幾何歪みを予測する新しい傾きマップ推定器も導入した。
提案手法では, 乱流のない画像や地対画像の合成は必要とせず, 注釈付きサンプルを著しく少なくする。
- 参考スコア(独自算出の注目度): 2.2263723609685773
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Face and person recognition have recently achieved remarkable success under
challenging scenarios, such as off-pose and cross-spectrum matching. However,
long-range recognition systems are often hindered by atmospheric turbulence,
leading to spatially and temporally varying distortions in the image. Current
solutions rely on generative models to reconstruct a turbulent-free image, but
often preserve photo-realism instead of discriminative features that are
essential for recognition. This can be attributed to the lack of large-scale
datasets of turbulent and pristine paired images, necessary for optimal
reconstruction. To address this issue, we propose a new weakly supervised
framework that employs a parameter-efficient self-attention module to generate
domain agnostic representations, aligning turbulent and pristine images into a
common subspace. Additionally, we introduce a new tilt map estimator that
predicts geometric distortions observed in turbulent images. This estimate is
used to re-rank gallery matches, resulting in up to 13.86\% improvement in
rank-1 accuracy. Our method does not require synthesizing turbulent-free images
or ground-truth paired images, and requires significantly fewer annotated
samples, enabling more practical and rapid utility of increasingly large
datasets. We analyze our framework using two datasets -- Long-Range Face
Identification Dataset (LRFID) and BRIAR Government Collection 1 (BGC1) --
achieving enhanced discriminability under varying turbulence and standoff
distance.
- Abstract(参考訳): 顔と人物の認識は、最近、オフポスやクロススペクトラムマッチングといった困難なシナリオで顕著な成功を収めている。
しかし、長距離認識システムは、しばしば大気の乱流によって妨げられ、画像の空間的および時間的歪みに繋がる。
現在の解決策は、乱れのない画像を再構成するために生成モデルに依存するが、認識に不可欠な識別的特徴ではなく、しばしばフォトリアリズムを保存する。
これは、最適な再構成に必要な乱流と原始のペア画像の大規模なデータセットが欠如していることに起因する。
この問題に対処するために,パラメータ効率のよい自己アテンションモジュールを用いて,領域非依存な表現を生成し,乱流画像とpristine画像を共通部分空間に整列する,新たな弱教師付きフレームワークを提案する。
さらに,乱流画像で観測される幾何歪みを予測する新しい傾きマップ推定器を導入する。
この推定値はギャラリーマッチの再ランク付けに使われ、結果としてランク1の精度が最大13.86\%向上する。
提案手法では, 乱流のない画像や地対画像の合成は必要とせず, 注釈付きサンプルが著しく少なくなり, 大規模データセットの実用的, 迅速な利用が可能となった。
我々はLong-Range Face Identification Dataset (LRFID) とBRIAR Government Collection 1 (BGC1) の2つのデータセットを用いてフレームワークを解析し、乱流と待機距離の変化による識別性の向上を実現する。
関連論文リスト
- Multi-Feature Aggregation in Diffusion Models for Enhanced Face Super-Resolution [6.055006354743854]
超解像を生成するために,複数の低画質画像から抽出した特徴と組み合わせた低解像度画像を利用するアルゴリズムを開発した。
他のアルゴリズムとは異なり、我々のアプローチは属性情報を明示的に提供せずに顔の特徴を復元する。
これは、高解像度画像と低解像度画像を組み合わせて、より信頼性の高い超高解像度画像を生成するコンディショナーとして初めて使用される。
論文 参考訳(メタデータ) (2024-08-27T20:08:33Z) - Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z) - Supervision by Denoising for Medical Image Segmentation [17.131944478890293]
そこで我々は,自身のソフトラベルを用いてモデルを監督するフレームワークであるSUD(Superervision by Denoising)を提案する。
SUDは平均的および空間的デノナイジング技術をデノナイジングフレームワークで統合し、デノナイジングとモデルウェイト更新のステップを交互に行う。
応用例として,バイオメディカルイメージングによる2つの問題にSUDを適用した。
論文 参考訳(メタデータ) (2022-02-07T05:29:16Z) - LTT-GAN: Looking Through Turbulence by Inverting GANs [86.25869403782957]
本稿では,よく訓練されたGANによってカプセル化された視覚的事前情報を利用した最初の乱流緩和手法を提案する。
視覚的先行性に基づき、周期的な文脈距離で復元された画像の同一性を維持することを学ぶことを提案する。
本手法は, 回復した結果の視覚的品質と顔認証精度の両方において, 先行技術よりも優れていた。
論文 参考訳(メタデータ) (2021-12-04T16:42:13Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。