論文の概要: Rawgment: Noise-Accounted RAW Augmentation Enables Recognition in a Wide
Variety of Environments
- arxiv url: http://arxiv.org/abs/2210.16046v1
- Date: Fri, 28 Oct 2022 10:33:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 17:19:35.831146
- Title: Rawgment: Noise-Accounted RAW Augmentation Enables Recognition in a Wide
Variety of Environments
- Title(参考訳): rawgment: ノイズ対応raw拡張は多様な環境における認識を可能にする
- Authors: Masakazu Yoshimura, Junji Otsuka, Atsushi Irie, Takeshi Ohashi
- Abstract要約: 本稿では,難易度の高い環境における画像認識のための雑音対応RAW画像強調手法を提案する。
本質的には、非線形ISPを適用する前にRAW画像に色ジッタとぼかし増大を施し、現実的な強度が得られる。
提案手法は,簡単な学習データのみを用いて,難易度の高い環境下での音声認識精度を2倍にすることを示す。
- 参考スコア(独自算出の注目度): 1.0323063834827415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image recognition models that can work in challenging environments (e.g.,
extremely dark, blurry, or high dynamic range conditions) must be useful.
However, creating a training dataset for such environments is expensive and
hard due to the difficulties of data collection and annotation. It is desirable
if we could get a robust model without the need of hard-to-obtain dataset. One
simple approach is to apply data augmentation such as color jitter and blur to
standard RGB (sRGB) images in simple scenes. Unfortunately, this approach
struggles to yield realistic images in terms of pixel intensity and noise
distribution due to not considering the non-linearity of Image Signal Processor
(ISP) and noise characteristics of an image sensor. Instead, we propose a
noise-accounted RAW image augmentation method. In essence, color jitter and
blur augmentation are applied to a RAW image before applying non-linear ISP,
yielding realistic intensity. Furthermore, we introduce a noise amount
alignment method that calibrates the domain gap in noise property caused by the
augmentation. We show that our proposed noise-accounted RAW augmentation method
doubles the image recognition accuracy in challenging environments only with
simple training data.
- Abstract(参考訳): 困難な環境で機能する画像認識モデル(例えば、極暗、ぼやけ、高ダイナミックレンジ条件など)は有用である必要がある。
しかし、データ収集とアノテーションの難しさのため、そのような環境のためのトレーニングデータセットの作成は高価で難しい。
難しいデータセットを必要とせずに堅牢なモデルが得られればよいのです。
1つの単純なアプローチは、単純なシーンで標準的なRGB(sRGB)画像に色ジッタやぼやけなどのデータ拡張を適用することである。
残念なことに、このアプローチは画像信号処理装置(isp)の非線形性や画像センサのノイズ特性を考慮していないため、画素強度やノイズ分布の観点から現実的な画像を生成するのに苦労している。
代わりに,ノイズを考慮した生画像拡張法を提案する。
本質的には、非線形ISPを適用する前にRAW画像に色ジッタとぼかし増大を施し、現実的な強度が得られる。
さらに,拡張による雑音特性の領域ギャップを校正する雑音量アライメント手法を提案する。
提案手法は,簡易な学習データのみを用いて,課題環境における画像認識精度を2倍にする。
関連論文リスト
- RAW-Diffusion: RGB-Guided Diffusion Models for High-Fidelity RAW Image Generation [4.625376287612609]
RGB画像でガイドされたRAW画像を生成するための新しい拡散法を提案する。
このアプローチは高忠実度RAW画像を生成し、カメラ固有のRAWデータセットの作成を可能にする。
提案手法を拡張してBDD100K-RAWとCityscapes-RAWデータセットを作成し,RAW画像におけるオブジェクト検出の有効性を明らかにする。
論文 参考訳(メタデータ) (2024-11-20T09:40:12Z) - Retinex-RAWMamba: Bridging Demosaicing and Denoising for Low-Light RAW Image Enhancement [71.13353154514418]
低照度画像の強化、特に生ドメインからsRGBドメインへのマッピングのようなクロスドメインタスクは、依然として大きな課題である。
RAWMambaと呼ばれる新しいMambaスキャニング機構を提案する。
また,Retinex の先行したRetinex Decomposition Module (RDM) も提案する。
論文 参考訳(メタデータ) (2024-09-11T06:12:03Z) - NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Dataset [53.79524776100983]
近赤外(NIR)画像を活用して、視認可能なRGB画像の復調を支援することで、この問題に対処する可能性を示している。
既存の作品では、NIR情報を効果的に活用して現実のイメージを飾ることに苦戦している。
先進デノナイジングネットワークにプラグイン・アンド・プレイ可能な効率的な選択核融合モジュール(SFM)を提案する。
論文 参考訳(メタデータ) (2024-04-12T14:54:26Z) - BSRAW: Improving Blind RAW Image Super-Resolution [63.408484584265985]
RAW領域におけるブラインド画像の超解像化に取り組む。
生センサデータを用いたトレーニングモデルに特化した,現実的な劣化パイプラインを設計する。
私たちのパイプラインでトレーニングしたBSRAWモデルは、リアルタイムRAW画像をスケールアップし、品質を向上させることができます。
論文 参考訳(メタデータ) (2023-12-24T14:17:28Z) - Reversed Image Signal Processing and RAW Reconstruction. AIM 2022
Challenge Report [109.2135194765743]
本稿では,AIM 2022 Challenge on Reversed Image Signal Processing and RAW Reconstructionを紹介する。
我々は,メタデータを使わずにRGBから生のセンサイメージを回収し,ISP変換を「逆」することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T10:43:53Z) - Modeling sRGB Camera Noise with Normalizing Flows [35.29066692454865]
各種ISOレベルにおけるsRGB画像の複雑な雑音分布を学習できる正規化フローに基づく新しいsRGB領域雑音モデルを提案する。
我々の正規化フローベースアプローチは、ノイズモデリングや合成タスクにおいて、他のモデルよりも優れています。
論文 参考訳(メタデータ) (2022-06-02T00:56:34Z) - Learning to Generate Realistic Noisy Images via Pixel-level Noise-aware
Adversarial Training [50.018580462619425]
我々は,PNGAN(Pixel-level Noise-aware Generative Adrial Network)という新しいフレームワークを提案する。
PNGANは、トレーニング済みのリアルデノイザーを使用して、フェイク画像とリアルノイズ画像をほぼノイズのないソリューション空間にマッピングする。
より優れたノイズフィッティングを実現するため,ジェネレータとしてSimple Multi-versa-scale Network (SMNet) を提案する。
論文 参考訳(メタデータ) (2022-04-06T14:09:02Z) - Model-Based Image Signal Processors via Learnable Dictionaries [6.766416093990318]
デジタルカメラは画像信号処理装置(ISP)を用いてRAW読み出しをRGB画像に変換する
近年のアプローチでは、RGBからRAWマッピングを推定することで、このギャップを埋めようとしている。
本稿では,学習可能かつ解釈可能なハイブリッド・モデルベースかつデータ駆動型ISPを提案する。
論文 参考訳(メタデータ) (2022-01-10T08:36:10Z) - Adaptive Unfolding Total Variation Network for Low-Light Image
Enhancement [6.531546527140475]
sRGB空間における既存の拡張アルゴリズムのほとんどは、低可視性問題にのみ焦点をあてるか、仮説的雑音レベルの下でノイズを抑圧する。
本稿では,実際のsRGB低照度画像から雑音レベルを近似する適応展開全変動ネットワーク(UTVNet)を提案する。
実世界の低照度画像に対する実験は、最先端の手法よりもUTVNetの優れた性能を明らかに示している。
論文 参考訳(メタデータ) (2021-10-03T11:22:17Z) - CycleISP: Real Image Restoration via Improved Data Synthesis [166.17296369600774]
本稿では,前向きと逆方向のカメラ画像パイプラインをモデル化するフレームワークを提案する。
リアルな合成データに基づいて新しい画像認識ネットワークをトレーニングすることにより、実際のカメラベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-17T15:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。