論文の概要: Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition
- arxiv url: http://arxiv.org/abs/2303.04291v2
- Date: Tue, 31 Oct 2023 00:18:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 03:43:35.146227
- Title: Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition
- Title(参考訳): 暗黒における拡散:低光度テキスト認識のための拡散モデル
- Authors: Cindy M. Nguyen, Eric R. Chan, Alexander W. Bergman, Gordon Wetzstein
- Abstract要約: ディフュージョン・イン・ザ・ダーク (Diffusion in the Dark, DiD) は、テキスト認識のための低照度画像再構成のための拡散モデルである。
実画像上での低照度テキスト認識において,Digital DiDがSOTAの低照度手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 78.50328335703914
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Capturing images is a key part of automation for high-level tasks such as
scene text recognition. Low-light conditions pose a challenge for high-level
perception stacks, which are often optimized on well-lit, artifact-free images.
Reconstruction methods for low-light images can produce well-lit counterparts,
but typically at the cost of high-frequency details critical for downstream
tasks. We propose Diffusion in the Dark (DiD), a diffusion model for low-light
image reconstruction for text recognition. DiD provides qualitatively
competitive reconstructions with that of state-of-the-art (SOTA), while
preserving high-frequency details even in extremely noisy, dark conditions. We
demonstrate that DiD, without any task-specific optimization, can outperform
SOTA low-light methods in low-light text recognition on real images, bolstering
the potential of diffusion models to solve ill-posed inverse problems.
- Abstract(参考訳): 画像のキャプチャは、シーンテキスト認識のようなハイレベルなタスクの自動化の重要な部分である。
低照度条件は、しばしばよく照らされたアーティファクトフリーな画像に最適化された高レベルの知覚スタックにとって課題となる。
低照度画像の再構成手法は、よく照らされた画像を生成するが、通常は下流タスクにとって重要な周波数詳細のコストがかかる。
テキスト認識のための低照度画像再構成のための拡散モデルであるDiffusion in the Dark (DiD)を提案する。
DiDは最先端のSOTA (State-of-the-art) と定性的に競合する再構築を提供し、非常にノイズの多い暗黒条件でも高周波の詳細を保存できる。
実画像上での低照度テキスト認識におけるSOTAの低照度手法を,タスク固有の最適化を伴わずに実現し,不適切な逆問題に対する拡散モデルの可能性を高めることを実証した。
関連論文リスト
- CDAN: Convolutional Dense Attention-guided Network for Low-light Image
Enhancement [2.532202013576547]
低照度画像は、明度が低下し、色が変色し、細部が小さくなるという課題を生んでいる。
本稿では,低照度画像を改善するための新しいソリューションであるCDAN(Convolutional Dense Attention-guided Network)を紹介する。
CDANは自動エンコーダベースのアーキテクチャと、アテンション機構とスキップ接続によって補完される、畳み込みブロックと密集ブロックを統合している。
論文 参考訳(メタデータ) (2023-08-24T16:22:05Z) - Enhancing Low-light Light Field Images with A Deep Compensation
Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Single Image LDR to HDR Conversion using Conditional Diffusion [18.466814193413487]
デジタル画像は現実的なシーンを再現することを目的としているが、Low Dynamic Range(LDR)カメラは現実のシーンの広いダイナミックレンジを表現できない。
本稿では,影やハイライトから複雑な詳細を復元するための深層学習に基づくアプローチを提案する。
提案フレームワークにディープベースオートエンコーダを組み込んで,コンディショニングに使用するLDR画像の潜在表現の質を高める。
論文 参考訳(メタデータ) (2023-07-06T07:19:47Z) - Enhancing Low-Light Images in Real World via Cross-Image Disentanglement [58.754943762945864]
そこで本研究では,現実の汚職とミスアライメントされたトレーニング画像からなる,新しい低照度画像強調データセットを提案する。
本モデルでは,新たに提案したデータセットと,他の一般的な低照度データセットの両方に対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-01-10T03:12:52Z) - Invertible Network for Unpaired Low-light Image Enhancement [78.33382003460903]
本稿では,非可逆的ネットワークを活用して,前処理における低照度画像の強化と,非対向学習により逆向きに通常の照度画像の劣化を図ることを提案する。
対向的損失に加えて、トレーニングの安定性を確保し、より詳細な画像を保存するために、様々な損失関数を設計する。
低照度画像に対するプログレッシブ自己誘導強調処理を提案し,SOTAに対して良好な性能を示す。
論文 参考訳(メタデータ) (2021-12-24T17:00:54Z) - Burst Imaging for Light-Constrained Structure-From-Motion [4.125187280299246]
低光環境下で得られた画像から3次元再構成を支援する画像処理技術を開発した。
バースト写真に基づく本手法は,短時間露光画像のバースト内における画像登録に直接的手法を用いる。
本手法は,低光環境下でのロボットの動作を可能にするための重要なステップであり,地中鉱山や夜間作業などの環境におけるロボットの動作に応用できる可能性がある。
論文 参考訳(メタデータ) (2021-08-23T02:12:40Z) - Deep Bilateral Retinex for Low-Light Image Enhancement [96.15991198417552]
低照度画像は、低コントラスト、色歪み、測定ノイズによる視界の低下に悩まされる。
本稿では,低照度画像強調のための深層学習手法を提案する。
提案手法は最先端の手法と非常に競合し, 極めて低照度で撮影した画像の処理において, 他に比べて大きな優位性を有する。
論文 参考訳(メタデータ) (2020-07-04T06:26:44Z) - Low-light Image Restoration with Short- and Long-exposure Raw Pairs [14.643663950015334]
短時間・長時間露光画像の相補的情報を用いた新しい低照度画像復元手法を提案する。
まず,現実的な短時間・長時間露光生画像の合成のための新しいデータ生成手法を提案する。
そこで我々は,低照度画像融合の問題に対処するため,LSFNet(Long-Short-Exposure fusion Network)を新たに設計した。
論文 参考訳(メタデータ) (2020-07-01T03:22:26Z) - Unsupervised Low-light Image Enhancement with Decoupled Networks [103.74355338972123]
我々は、実世界の低照度画像を教師なしで拡張する2段階のGANベースのフレームワークを学習する。
提案手法は,照度向上と雑音低減の両面から,最先端の教師なし画像強調法より優れる。
論文 参考訳(メタデータ) (2020-05-06T13:37:08Z) - Learning an Adaptive Model for Extreme Low-light Raw Image Processing [5.706764509663774]
画質向上のための適応型低照度生画像強調ネットワークを提案する。
提案手法は、最先端の低照度アルゴリズムと比較してノイズレベル推定(NLE)のスコアが低い。
ビデオ処理における潜在的な応用について概説する。
論文 参考訳(メタデータ) (2020-04-22T09:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。