論文の概要: Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition
- arxiv url: http://arxiv.org/abs/2303.04291v2
- Date: Tue, 31 Oct 2023 00:18:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 03:43:35.146227
- Title: Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition
- Title(参考訳): 暗黒における拡散:低光度テキスト認識のための拡散モデル
- Authors: Cindy M. Nguyen, Eric R. Chan, Alexander W. Bergman, Gordon Wetzstein
- Abstract要約: ディフュージョン・イン・ザ・ダーク (Diffusion in the Dark, DiD) は、テキスト認識のための低照度画像再構成のための拡散モデルである。
実画像上での低照度テキスト認識において,Digital DiDがSOTAの低照度手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 78.50328335703914
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Capturing images is a key part of automation for high-level tasks such as
scene text recognition. Low-light conditions pose a challenge for high-level
perception stacks, which are often optimized on well-lit, artifact-free images.
Reconstruction methods for low-light images can produce well-lit counterparts,
but typically at the cost of high-frequency details critical for downstream
tasks. We propose Diffusion in the Dark (DiD), a diffusion model for low-light
image reconstruction for text recognition. DiD provides qualitatively
competitive reconstructions with that of state-of-the-art (SOTA), while
preserving high-frequency details even in extremely noisy, dark conditions. We
demonstrate that DiD, without any task-specific optimization, can outperform
SOTA low-light methods in low-light text recognition on real images, bolstering
the potential of diffusion models to solve ill-posed inverse problems.
- Abstract(参考訳): 画像のキャプチャは、シーンテキスト認識のようなハイレベルなタスクの自動化の重要な部分である。
低照度条件は、しばしばよく照らされたアーティファクトフリーな画像に最適化された高レベルの知覚スタックにとって課題となる。
低照度画像の再構成手法は、よく照らされた画像を生成するが、通常は下流タスクにとって重要な周波数詳細のコストがかかる。
テキスト認識のための低照度画像再構成のための拡散モデルであるDiffusion in the Dark (DiD)を提案する。
DiDは最先端のSOTA (State-of-the-art) と定性的に競合する再構築を提供し、非常にノイズの多い暗黒条件でも高周波の詳細を保存できる。
実画像上での低照度テキスト認識におけるSOTAの低照度手法を,タスク固有の最適化を伴わずに実現し,不適切な逆問題に対する拡散モデルの可能性を高めることを実証した。
関連論文リスト
- CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [97.95330185793358]
低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。
既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。
我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文 参考訳(メタデータ) (2024-04-08T07:34:39Z) - LDM-ISP: Enhancing Neural ISP for Low Light with Latent Diffusion Models [54.93010869546011]
本稿では,事前学習した潜伏拡散モデルを用いて,超低照度画像の高精細化のためのニューラルISPを実現することを提案する。
具体的には、RAWドメイン上で動作するために事前訓練された潜在拡散モデルを調整するために、軽量なテーミングモジュールのセットをトレーニングする。
遅延拡散モデルにおけるUNet復調と復号化の異なる役割を観察し、低照度画像強調タスクを遅延空間低周波コンテンツ生成と復号位相高周波ディテール保守に分解するきっかけとなる。
論文 参考訳(メタデータ) (2023-12-02T04:31:51Z) - Single Image LDR to HDR Conversion using Conditional Diffusion [18.466814193413487]
デジタル画像は現実的なシーンを再現することを目的としているが、Low Dynamic Range(LDR)カメラは現実のシーンの広いダイナミックレンジを表現できない。
本稿では,影やハイライトから複雑な詳細を復元するための深層学習に基づくアプローチを提案する。
提案フレームワークにディープベースオートエンコーダを組み込んで,コンディショニングに使用するLDR画像の潜在表現の質を高める。
論文 参考訳(メタデータ) (2023-07-06T07:19:47Z) - Enhancing Low-Light Images in Real World via Cross-Image Disentanglement [58.754943762945864]
そこで本研究では,現実の汚職とミスアライメントされたトレーニング画像からなる,新しい低照度画像強調データセットを提案する。
本モデルでは,新たに提案したデータセットと,他の一般的な低照度データセットの両方に対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-01-10T03:12:52Z) - Burst Imaging for Light-Constrained Structure-From-Motion [4.125187280299246]
低光環境下で得られた画像から3次元再構成を支援する画像処理技術を開発した。
バースト写真に基づく本手法は,短時間露光画像のバースト内における画像登録に直接的手法を用いる。
本手法は,低光環境下でのロボットの動作を可能にするための重要なステップであり,地中鉱山や夜間作業などの環境におけるロボットの動作に応用できる可能性がある。
論文 参考訳(メタデータ) (2021-08-23T02:12:40Z) - Deep Bilateral Retinex for Low-Light Image Enhancement [96.15991198417552]
低照度画像は、低コントラスト、色歪み、測定ノイズによる視界の低下に悩まされる。
本稿では,低照度画像強調のための深層学習手法を提案する。
提案手法は最先端の手法と非常に競合し, 極めて低照度で撮影した画像の処理において, 他に比べて大きな優位性を有する。
論文 参考訳(メタデータ) (2020-07-04T06:26:44Z) - Low-light Image Restoration with Short- and Long-exposure Raw Pairs [14.643663950015334]
短時間・長時間露光画像の相補的情報を用いた新しい低照度画像復元手法を提案する。
まず,現実的な短時間・長時間露光生画像の合成のための新しいデータ生成手法を提案する。
そこで我々は,低照度画像融合の問題に対処するため,LSFNet(Long-Short-Exposure fusion Network)を新たに設計した。
論文 参考訳(メタデータ) (2020-07-01T03:22:26Z) - Unsupervised Low-light Image Enhancement with Decoupled Networks [103.74355338972123]
我々は、実世界の低照度画像を教師なしで拡張する2段階のGANベースのフレームワークを学習する。
提案手法は,照度向上と雑音低減の両面から,最先端の教師なし画像強調法より優れる。
論文 参考訳(メタデータ) (2020-05-06T13:37:08Z) - Learning an Adaptive Model for Extreme Low-light Raw Image Processing [5.706764509663774]
画質向上のための適応型低照度生画像強調ネットワークを提案する。
提案手法は、最先端の低照度アルゴリズムと比較してノイズレベル推定(NLE)のスコアが低い。
ビデオ処理における潜在的な応用について概説する。
論文 参考訳(メタデータ) (2020-04-22T09:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。