論文の概要: GDIP: Gated Differentiable Image Processing for Object-Detection in
Adverse Conditions
- arxiv url: http://arxiv.org/abs/2209.14922v1
- Date: Thu, 29 Sep 2022 16:43:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 18:05:00.560788
- Title: GDIP: Gated Differentiable Image Processing for Object-Detection in
Adverse Conditions
- Title(参考訳): GDIP:逆条件における物体検出のためのGated Differentiable Image Processing
- Authors: Sanket Kalwar, Dhruv Patel, Aakash Aanegola, Krishna Reddy Konda,
Sourav Garg, K Madhava Krishna
- Abstract要約: 本稿では,ドメインに依存しないネットワークアーキテクチャであるGated Differentiable Image Processing (GDIP)ブロックを提案する。
提案するGDIPブロックは、下流の物体検出損失から画像を直接拡張することを学ぶ。
いくつかの最先端手法による検出性能の大幅な向上を示す。
- 参考スコア(独自算出の注目度): 15.327704761260131
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting objects under adverse weather and lighting conditions is crucial
for the safe and continuous operation of an autonomous vehicle, and remains an
unsolved problem. We present a Gated Differentiable Image Processing (GDIP)
block, a domain-agnostic network architecture, which can be plugged into
existing object detection networks (e.g., Yolo) and trained end-to-end with
adverse condition images such as those captured under fog and low lighting. Our
proposed GDIP block learns to enhance images directly through the downstream
object detection loss. This is achieved by learning parameters of multiple
image pre-processing (IP) techniques that operate concurrently, with their
outputs combined using weights learned through a novel gating mechanism. We
further improve GDIP through a multi-stage guidance procedure for progressive
image enhancement. Finally, trading off accuracy for speed, we propose a
variant of GDIP that can be used as a regularizer for training Yolo, which
eliminates the need for GDIP-based image enhancement during inference,
resulting in higher throughput and plausible real-world deployment. We
demonstrate significant improvement in detection performance over several
state-of-the-art methods through quantitative and qualitative studies on
synthetic datasets such as PascalVOC, and real-world foggy (RTTS) and
low-lighting (ExDark) datasets.
- Abstract(参考訳): 悪天候や照明条件下での物体の検出は、自動運転車の安全かつ継続的な運用に不可欠であり、未解決の問題である。
Gated Differentiable Image Processing (GDIP) ブロックはドメインに依存しないネットワークアーキテクチャで、既存のオブジェクト検出ネットワーク(ヨロなど)に接続でき、霧や低照度といった悪条件の画像でエンドツーエンドに訓練することができる。
提案するgdipブロックは,下流の物体検出損失から直接画像の強調を行う。
これは、複数の画像前処理(IP)技術のパラメータを学習し、その出力を新しいゲーティング機構で学習した重みを使って組み合わせることで達成される。
プログレッシブ画像強調のための多段階誘導手順によりGDIPをさらに改善する。
最後に,速度の精度をトレードオフして,Yoloのトレーニング用レギュレータとして使用できるGDIPの変種を提案し,推論中のGDIPベースの画像強調の必要性を排除し,高いスループットと実用的な実環境展開を実現する。
本研究では,PascalVOCやRTTS,低照度(ExDark)データセットなどの合成データセットの定量的,定性的な研究を通じて,最先端手法による検出性能の大幅な向上を示す。
関連論文リスト
- Time Step Generating: A Universal Synthesized Deepfake Image Detector [0.4488895231267077]
汎用合成画像検出器 Time Step Generating (TSG) を提案する。
TSGは、事前訓練されたモデルの再構築能力、特定のデータセット、サンプリングアルゴリズムに依存していない。
我々は,提案したTSGを大規模GenImageベンチマークで検証し,精度と一般化性の両方において大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-11-17T09:39:50Z) - DA-HFNet: Progressive Fine-Grained Forgery Image Detection and Localization Based on Dual Attention [12.36906630199689]
DA-HFNet鍛造画像データセットをテキストまたは画像支援GANおよび拡散モデルで作成する。
我々のゴールは、階層的なプログレッシブネットワークを使用して、異なるスケールの偽造物を検出およびローカライゼーションするために捕獲することである。
論文 参考訳(メタデータ) (2024-06-03T16:13:33Z) - Robust CLIP-Based Detector for Exposing Diffusion Model-Generated Images [13.089550724738436]
拡散モデル(DM)は画像生成に革命をもたらし、様々な分野にまたがる高品質な画像を生成する。
超現実的画像を作成する能力は、現実的コンテンツと合成的コンテンツを区別する上で大きな課題となる。
この研究は、CLIPモデルによって抽出された画像とテキストの特徴をMLP(Multilayer Perceptron)分類器と統合する堅牢な検出フレームワークを導入する。
論文 参考訳(メタデータ) (2024-04-19T14:30:41Z) - FriendNet: Detection-Friendly Dehazing Network [24.372610892854283]
本稿では,イメージデハジングとオブジェクト検出を,ガイダンス情報とタスク駆動学習によってブリッジする効果的なアーキテクチャを提案する。
FriendNetは、高品質な認識と高い検出能力の両方を提供することを目指している。
論文 参考訳(メタデータ) (2024-03-07T12:19:04Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Lightweight HDR Camera ISP for Robust Perception in Dynamic Illumination
Conditions via Fourier Adversarial Networks [35.532434169432776]
照明とノイズ除去の逐次的バランスをとる軽量な2段階画像強調アルゴリズムを提案する。
また、異なる照明条件下での一貫した画像強調のためのフーリエスペクトルベース対向フレームワーク(AFNet)を提案する。
また,定量的および定性的な評価に基づいて,画像強調技術が共通認識タスクの性能に与える影響について検討した。
論文 参考訳(メタデータ) (2022-04-04T18:48:51Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - Removing Diffraction Image Artifacts in Under-Display Camera via Dynamic
Skip Connection Network [80.67717076541956]
アンダーディスプレイカメラ(UDC)システムは、スマートフォン上で真のベゼルレスおよびノッチフリーの視聴体験を提供します。
典型的なUDCシステムでは、ピクセルアレイはカメラ上の入射光を減衰および回折し、画像品質の大幅な低下をもたらす。
本研究では,前述の劣化問題の解析と対処を目的とする。
論文 参考訳(メタデータ) (2021-04-19T18:41:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。