論文の概要: URIE: Universal Image Enhancement for Visual Recognition in the Wild
- arxiv url: http://arxiv.org/abs/2007.08979v3
- Date: Fri, 24 Jul 2020 12:21:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 14:14:53.650857
- Title: URIE: Universal Image Enhancement for Visual Recognition in the Wild
- Title(参考訳): URIE: 野生での視覚認識のためのユニバーサルイメージの強化
- Authors: Taeyoung Son, Juwon Kang, Namyup Kim, Sunghyun Cho and Suha Kwak
- Abstract要約: 本稿では、URIEと呼ばれる、ユニバーサルで認識しやすい画像強調ネットワークについて紹介する。
提案実験は,入力画像が劣化した場合に,URIEが様々な画像歪みや潜伏画像歪みを処理し,既存のモデルの性能を5つの多様な認識タスクで改善できることを実証する。
- 参考スコア(独自算出の注目度): 24.69158562574226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the great advances in visual recognition, it has been witnessed that
recognition models trained on clean images of common datasets are not robust
against distorted images in the real world. To tackle this issue, we present a
Universal and Recognition-friendly Image Enhancement network, dubbed URIE,
which is attached in front of existing recognition models and enhances
distorted input to improve their performance without retraining them. URIE is
universal in that it aims to handle various factors of image degradation and to
be incorporated with any arbitrary recognition models. Also, it is
recognition-friendly since it is optimized to improve the robustness of
following recognition models, instead of perceptual quality of output image.
Our experiments demonstrate that URIE can handle various and latent image
distortions and improve the performance of existing models for five diverse
recognition tasks when input images are degraded.
- Abstract(参考訳): 視覚認識の大きな進歩にもかかわらず、一般的なデータセットのクリーンイメージでトレーニングされた認識モデルは、現実世界の歪んだ画像に対して堅牢ではないことが目撃されている。
そこで本研究では,既存の認識モデルの前に装着し,歪んだ入力を増大させ,再学習することなくその性能を向上させる,ユニバーサルで認識に優しい画像強調ネットワーク urie を提案する。
URIEは、画像劣化の様々な要因に対処し、任意の認識モデルに組み込むことを目的としている。
また、出力画像の知覚品質ではなく、後続の認識モデルの堅牢性の向上に最適化されているため、認識に親しみやすい。
実験により,urieは様々な画像歪みを処理でき,入力画像の劣化時に既存のモデルの性能を向上させることができた。
関連論文リスト
- RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection [60.960988614701414]
RIGIDは、堅牢なAI生成画像検出のためのトレーニング不要でモデルに依存しない方法である。
RIGIDは、既存のトレーニングベースおよびトレーニング不要な検出器を著しく上回っている。
論文 参考訳(メタデータ) (2024-05-30T14:49:54Z) - ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning [57.91881829308395]
AIポートレートや広告といった幅広いアプリケーションシナリオのために、ID-T2I(ID-preserving text-to-image generation)が注目されている。
我々は,ID-T2I性能を向上させるための一般的なフィードバック学習フレームワークである textbfID-Aligner を提案する。
論文 参考訳(メタデータ) (2024-04-23T18:41:56Z) - Effective Adapter for Face Recognition in the Wild [72.75516495170199]
私たちは、画像が低品質で現実世界の歪みに悩まされる、野生の顔認識の課題に取り組みます。
従来のアプローチでは、劣化した画像や、顔の復元技術を使って強化された画像を直接訓練するが、効果がないことが証明された。
高品質な顔データセットで訓練された既存の顔認識モデルを強化するための効果的なアダプタを提案する。
論文 参考訳(メタデータ) (2023-12-04T08:55:46Z) - Towards Robust GAN-generated Image Detection: a Multi-view Completion
Representation [27.483031588071942]
GAN生成画像検出は、ディープフェイクのようなマシン合成画像操作の悪意ある使用に対する最初の防御線となっている。
本稿では,新しい多視点画像補完表現に基づくロバスト検出フレームワークを提案する。
我々は,6つのGANに対して異なる解像度でフレームワークの一般化能力を評価し,その幅広い摂動攻撃に対する堅牢性を評価する。
論文 参考訳(メタデータ) (2023-06-02T08:38:02Z) - Dynamic Test-Time Augmentation via Differentiable Functions [3.686808512438363]
DynTTAは、認識モデルを再訓練することなく、認識に優しい画像を生成する画像強調手法である。
DynTTAは、微分可能なデータ拡張技術に基づいて、多くの画像からブレンド画像を生成し、分布シフト時の認識精度を向上させる。
論文 参考訳(メタデータ) (2022-12-09T06:06:47Z) - Self-supervised GAN Detector [10.963740942220168]
生成モデルは 不正や 破壊 偽ニュースなど 悪意のある目的で悪用される
トレーニング設定外の未確認画像を識別する新しいフレームワークを提案する。
提案手法は,GAN画像の高品質な人工指紋を再構成する人工指紋生成装置から構成する。
論文 参考訳(メタデータ) (2021-11-12T06:19:04Z) - Identity-Aware CycleGAN for Face Photo-Sketch Synthesis and Recognition [61.87842307164351]
まず,画像生成ネットワークの監視に新たな知覚損失を適用したIACycleGAN(Identity-Aware CycleGAN)モデルを提案する。
眼や鼻などの重要な顔領域の合成により多くの注意を払うことで、フォトエッチング合成におけるサイクガンを改善する。
IACycleGANによる画像の合成を反復的に行う合成モデルと認識モデルとの相互最適化手法を開発した。
論文 参考訳(メタデータ) (2021-03-30T01:30:08Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - Cross-Resolution Adversarial Dual Network for Person Re-Identification
and Beyond [59.149653740463435]
人物再識別(re-ID)は、同一人物の画像をカメラビューでマッチングすることを目的としている。
カメラと関心のある人の距離が異なるため、解像度ミスマッチが期待できる。
本稿では,クロスレゾリューションな人物のリIDに対処する新たな生成的対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T07:21:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。