Fugu-MT 論文翻訳(概要): Weakly Supervised Face and Whole Body Recognition in Turbulent Environments

論文の概要: Weakly Supervised Face and Whole Body Recognition in Turbulent Environments

arxiv url: http://arxiv.org/abs/2308.11757v1
Date: Tue, 22 Aug 2023 19:58:02 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-24 17:00:49.971164
Title: Weakly Supervised Face and Whole Body Recognition in Turbulent Environments
Title（参考訳）: 乱流環境における弱教師付き顔と全身認識
Authors: Kshitij Nikhal, Benjamin S. Riggan
Abstract要約: 本稿では, 領域表現を生成し, 乱流像と原始像を共通部分空間に整列する, 弱教師付きフレームワークを提案する。また、乱流画像で観測される幾何歪みを予測する新しい傾きマップ推定器も導入した。提案手法では, 乱流のない画像や地対画像の合成は必要とせず, 注釈付きサンプルを著しく少なくする。
参考スコア（独自算出の注目度）: 2.2263723609685773
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Face and person recognition have recently achieved remarkable success under challenging scenarios, such as off-pose and cross-spectrum matching. However, long-range recognition systems are often hindered by atmospheric turbulence, leading to spatially and temporally varying distortions in the image. Current solutions rely on generative models to reconstruct a turbulent-free image, but often preserve photo-realism instead of discriminative features that are essential for recognition. This can be attributed to the lack of large-scale datasets of turbulent and pristine paired images, necessary for optimal reconstruction. To address this issue, we propose a new weakly supervised framework that employs a parameter-efficient self-attention module to generate domain agnostic representations, aligning turbulent and pristine images into a common subspace. Additionally, we introduce a new tilt map estimator that predicts geometric distortions observed in turbulent images. This estimate is used to re-rank gallery matches, resulting in up to 13.86\% improvement in rank-1 accuracy. Our method does not require synthesizing turbulent-free images or ground-truth paired images, and requires significantly fewer annotated samples, enabling more practical and rapid utility of increasingly large datasets. We analyze our framework using two datasets -- Long-Range Face Identification Dataset (LRFID) and BRIAR Government Collection 1 (BGC1) -- achieving enhanced discriminability under varying turbulence and standoff distance.
Abstract（参考訳）: 顔と人物の認識は、最近、オフポスやクロススペクトラムマッチングといった困難なシナリオで顕著な成功を収めている。しかし、長距離認識システムは、しばしば大気の乱流によって妨げられ、画像の空間的および時間的歪みに繋がる。現在の解決策は、乱れのない画像を再構成するために生成モデルに依存するが、認識に不可欠な識別的特徴ではなく、しばしばフォトリアリズムを保存する。これは、最適な再構成に必要な乱流と原始のペア画像の大規模なデータセットが欠如していることに起因する。この問題に対処するために,パラメータ効率のよい自己アテンションモジュールを用いて,領域非依存な表現を生成し,乱流画像とpristine画像を共通部分空間に整列する,新たな弱教師付きフレームワークを提案する。さらに,乱流画像で観測される幾何歪みを予測する新しい傾きマップ推定器を導入する。この推定値はギャラリーマッチの再ランク付けに使われ、結果としてランク1の精度が最大13.86\%向上する。提案手法では, 乱流のない画像や地対画像の合成は必要とせず, 注釈付きサンプルが著しく少なくなり, 大規模データセットの実用的, 迅速な利用が可能となった。我々はLong-Range Face Identification Dataset (LRFID) とBRIAR Government Collection 1 (BGC1) の2つのデータセットを用いてフレームワークを解析し、乱流と待機距離の変化による識別性の向上を実現する。

関連論文リスト

Diversity over Uniformity: Rethinking Representation in Generated Image Detection [22.020742109848317]
我々は、確実に生成された画像検出は、単一の決定経路に依存するのではなく、複数の判断視点を維持するべきであると論じている。本稿では,タスク非関係なコンポーネントをフィルタし,表現空間における様々なフォージェリーキュー間の過剰なオーバーラップを抑えるアンチファイン・コラプス学習フレームワークを提案する。この設計は、モデル内で多様な補完的な証拠を維持し、小さな敬意的な手がかりへの依存を減らし、目に見えない生成条件下で堅牢性を高める。
論文参考訳（メタデータ） (2026-02-28T15:42:12Z)
Reloc-VGGT: Visual Re-localization with Geometry Grounded Transformer [40.778996326009185]
初期核融合機構による多視点空間統合を行う最初のビジュアルローカライゼーションフレームワークを提案する。我々のフレームワークはVGGTのバックボーン上に構築されており、多視点3D形状を符号化している。本研究では,グローバルアテンションの2次複雑さを回避し,計算コストを削減する新しいスパースマスクアテンション戦略を提案する。
論文参考訳（メタデータ） (2025-12-26T06:12:17Z)
Revisiting Reconstruction-based AI-generated Image Detection: A Geometric Perspective [50.83711509908479]
幾何学的観点からの再構成誤差に対するヤコビアンスペクトル下界の導入について述べる。再構成多様体上の実画像は非自明な誤差下界を示し、多様体上の生成された画像はゼロに近い誤差を持つことを示す。本稿では,構造化編集操作を活用することで動的再構成誤差を計算できるReGapを提案する。
論文参考訳（メタデータ） (2025-10-29T03:45:03Z)
Beyond Frequency: Scoring-Driven Debiasing for Object Detection via Blueprint-Prompted Image Synthesis [97.37770785712475]
オブジェクト検出のための世代ベースデバイアスフレームワークを提案する。提案手法は,未表現オブジェクト群の性能ギャップを著しく狭める。
論文参考訳（メタデータ） (2025-10-21T02:19:12Z)
Behind the Noise: Conformal Quantile Regression Reveals Emergent Representations [0.2445561610325265]
本稿では,不確実性境界を校正した低品質測定を識別する機械学習手法を提案する。共形量子レグレッションを用いて訓練された軽量でランダムに構造化されたニューラルネットワークのアンサンブルを用いて,本手法は信頼性の高い復調を行う。実世界の地球生物化学イメージングデータに対するアプローチを検証し、自信ある解釈をサポートし、実験設計をガイドする方法を示す。
論文参考訳（メタデータ） (2025-05-13T02:27:12Z)
AerialMegaDepth: Learning Aerial-Ground Reconstruction and View Synthesis [57.249817395828174]
本研究では,3次元都市規模のメッシュからの擬似合成レンダリングと,実地レベルでのクラウドソース画像を組み合わせたスケーラブルなフレームワークを提案する。擬似合成データは、幅広い空中視点をシミュレートする一方、実際のクラウドソース画像は、地上レベルの画像の視覚的忠実度を改善するのに役立つ。このハイブリッドデータセットを使用して、いくつかの最先端のアルゴリズムを微調整し、実世界のゼロショット地上作業において大幅な改善を実現する。
論文参考訳（メタデータ） (2025-04-17T17:57:05Z)
A Diffusion-Based Framework for Terrain-Aware Remote Sensing Image Reconstruction [4.824120664293887]
SatelliteMakerは、さまざまなレベルのデータ損失で失われたデータを再構成する拡散ベースの方法である。条件入力としてのDEM(Digital Elevation Model)は、リアルな画像を生成するために調整されたプロンプトを使用する。分散損失に基づくVGG-Adapterモジュール。
論文参考訳（メタデータ） (2025-04-16T14:19:57Z)
Self-Supervised Enhancement of Forward-Looking Sonar Images: Bridging Cross-Modal Degradation Gaps through Feature Space Transformation and Multi-Frame Fusion [17.384482405769567]
前向きのソナー画像の強調は、正確な水中目標検出に不可欠である。本稿では,画素領域からソナー画像をロバストな特徴領域にマッピングする特徴空間変換を提案する。提案手法は既存の手法よりも優れ,ノイズを効果的に抑制し,詳細なエッジを保ち,明るさを大幅に改善する。
論文参考訳（メタデータ） (2025-04-15T08:34:56Z)
Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。主成分を凍結し,残った成分のみを適応させることで,偽造関係のパターンを学習しながら,事前学習した知識を保存できる。
論文参考訳（メタデータ） (2024-11-23T19:10:32Z)
Multi-Feature Aggregation in Diffusion Models for Enhanced Face Super-Resolution [6.055006354743854]
超解像を生成するために,複数の低画質画像から抽出した特徴と組み合わせた低解像度画像を利用するアルゴリズムを開発した。他のアルゴリズムとは異なり、我々のアプローチは属性情報を明示的に提供せずに顔の特徴を復元する。これは、高解像度画像と低解像度画像を組み合わせて、より信頼性の高い超高解像度画像を生成するコンディショナーとして初めて使用される。
論文参考訳（メタデータ） (2024-08-27T20:08:33Z)
Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文参考訳（メタデータ） (2024-01-01T14:14:35Z)
Robust Single Image Dehazing Based on Consistent and Contrast-Assisted Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。我々の手法は最先端のアプローチを大きく上回っている。
論文参考訳（メタデータ） (2022-03-29T08:11:04Z)
Supervision by Denoising for Medical Image Segmentation [17.131944478890293]
そこで我々は,自身のソフトラベルを用いてモデルを監督するフレームワークであるSUD(Superervision by Denoising)を提案する。 SUDは平均的および空間的デノナイジング技術をデノナイジングフレームワークで統合し、デノナイジングとモデルウェイト更新のステップを交互に行う。応用例として,バイオメディカルイメージングによる2つの問題にSUDを適用した。
論文参考訳（メタデータ） (2022-02-07T05:29:16Z)
LTT-GAN: Looking Through Turbulence by Inverting GANs [86.25869403782957]
本稿では,よく訓練されたGANによってカプセル化された視覚的事前情報を利用した最初の乱流緩和手法を提案する。視覚的先行性に基づき、周期的な文脈距離で復元された画像の同一性を維持することを学ぶことを提案する。本手法は, 回復した結果の視覚的品質と顔認証精度の両方において, 先行技術よりも優れていた。
論文参考訳（メタデータ） (2021-12-04T16:42:13Z)
Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文参考訳（メタデータ） (2021-11-27T12:12:57Z)
Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文参考訳（メタデータ） (2021-08-19T11:02:25Z)
Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文参考訳（メタデータ） (2020-02-07T03:45:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。