論文の概要: Pre-training Enables Extraordinary All-optical Image Denoising
- arxiv url: http://arxiv.org/abs/2605.07810v1
- Date: Fri, 08 May 2026 14:43:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.124861
- Title: Pre-training Enables Extraordinary All-optical Image Denoising
- Title(参考訳): 事前学習による全光学画像の非正規化が可能に
- Authors: Xudong Lv, Yuxiang Sun, Shuo Wang, Nanxing Chen, Jun Guan, Jingtian Hu,
- Abstract要約: 本稿では,事前学習型アプローチにより,画質が大幅に向上し,スナップショット画像のノイズ化につながることを報告する。
2段階のプロセスで最適化された回折ネットワークによる有効自由空間光デノナイズを実演した。
我々はさらに、顔検出、プレート認識、雑音下でのUAVの局在化など、視力に基づく応用における光学的デノイザの重要性を実証した。
- 参考スコア(独自算出の注目度): 14.509895751629578
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optical neural networks are emerging as powerful machine learning and information processing tools because of their potential advantages in speed and energy efficiency. The training methods of these physical models, however, remain underexplored compared to their digital counterparts and are leading to suboptimal performance. This paper reports a pre-training-driven approach that leads to snapshot image denoising with substantially improved quality. We demonstrated effective free-space optical denoising by a diffractive network optimized by a two-step process including (1) pre-training using a massive dataset of 3.45 million diverse but simple images and (2) fine-tuning with the corresponding task-specific datasets. Compared to conventional Fourier-domain filtering and directly trained diffractive networks, such a transfer learning process exhibited prominent advantages for denoising images degraded by severe noise, peak signal-to-noise ratio (PSNR) below 8 dB, while preserving fine image features and improving the PSNR to above 18 dB. Importantly, the same pre-trained optical network could be consistently fine-tuned to process degraded images from highly diverse styles ranging from handwritten digits (MNIST) and chest X-rays (ChestMNIST) to CIFAR-10 images and human faces (CelebA). We further demonstrated the critical role of our optical denoisers in vision-based applications, including face detection, plate recognition, and localization of UAVs in noisy conditions.
- Abstract(参考訳): 光ニューラルネットワークは、速度とエネルギー効率の潜在的なアドバンテージのため、強力な機械学習と情報処理ツールとして登場している。
しかし、これらの物理モデルのトレーニング方法は、デジタルモデルと比較してまだ未熟であり、最適以下のパフォーマンスをもたらす。
本稿では,事前学習型アプローチにより,画質が大幅に向上し,スナップショット画像のノイズ化につながることを報告する。
我々は,(1)345万の多様な単純な画像からなる大規模データセットを用いた事前学習,(2)タスク固有のデータセットによる微調整を含む,2段階のプロセスで最適化された拡散型ネットワークによる効果的な自由空間光復調を実演した。
従来のフーリエドメインフィルタや直接訓練された拡散ネットワークと比較して, 伝達学習プロセスは, 8dB未満の高雑音, ピーク信号-雑音比 (PSNR) で劣化した画像の分解に顕著な優位性を示し, 微細な画像特性の保存とPSNRの18dB以上の改善を図った。
重要なことに、同じトレーニング済みの光学ネットワークは、手書き桁(MNIST)や胸部X線(ChestMNIST)からCIFAR-10画像、人間の顔(CelebA)まで、非常に多様なスタイルの劣化画像を処理するために一貫して微調整することができる。
我々はさらに、顔検出、プレート認識、雑音下でのUAVの局在化など、視力に基づく応用における光学的デノイザの重要性を実証した。
関連論文リスト
- Self-Calibrated Variance-Stabilizing Transformations for Real-World Image Denoising [19.08732222562782]
教師付き深層学習が画像認知のための選択方法となっている。
一般の信条とは対照的に,ガウスノイズ除去に特化するネットワークを有効活用し,実世界の画像復調に有効であることを示す。
論文 参考訳(メタデータ) (2024-07-24T16:23:46Z) - Advancing Unsupervised Low-light Image Enhancement: Noise Estimation, Illumination Interpolation, and Self-Regulation [55.07472635587852]
低光画像強調(LLIE)技術は、画像の詳細の保存とコントラストの強化に顕著な進歩をもたらした。
これらのアプローチは、動的ノイズを効率的に緩和し、様々な低照度シナリオを収容する上で、永続的な課題に直面する。
まず,低照度画像の雑音レベルを迅速かつ高精度に推定する方法を提案する。
次に、照明と入力の一般的な制約を満たすために、Learningable Illumination Interpolator (LII) を考案する。
論文 参考訳(メタデータ) (2023-05-17T13:56:48Z) - Enhancing convolutional neural network generalizability via low-rank weight approximation [6.763245393373041]
十分なノイズ処理は、画像処理にとって重要な第一歩であることが多い。
ディープニューラルネットワーク(DNN)は画像のノイズ化に広く利用されている。
本研究では,タッカー低ランクテンソル近似に基づく自己教師付き画像復調フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:11:05Z) - Robust Deep Ensemble Method for Real-world Image Denoising [62.099271330458066]
そこで本研究では,実世界の画像認識のための単純なベイズディープアンサンブル(BDE)手法を提案する。
我々のBDEは、最先端の復調法よりも+0.28dBPSNRのゲインを達成している。
我々のBDEは他の画像復元タスクにも拡張でき、ベンチマークデータセット上で+0.30dB、+0.18dB、+0.12dB PSNRゲインを達成することができる。
論文 参考訳(メタデータ) (2022-06-08T06:19:30Z) - Unsupervised Denoising of Optical Coherence Tomography Images with
Dual_Merged CycleWGAN [3.3909577600092122]
そこで我々は,網膜CT画像復調のためのDual-Merged Cycle-WGANと呼ばれる新しいサイクル一貫性生成適応ネットを提案する。
本モデルでは,2つのCycle-GANネットワークとデクリミネータとワッセルシュタイン損失を併用して,優れたトレーニング安定性と性能を実現する。
論文 参考訳(メタデータ) (2022-05-02T07:38:19Z) - Zero-shot Blind Image Denoising via Implicit Neural Representations [77.79032012459243]
暗黙的ニューラル表現(INR)のアーキテクチャ的帰納的バイアスを利用した代替的認知戦略を提案する。
提案手法は,低雑音シナリオや実雑音シナリオの広い範囲において,既存のゼロショット復調手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-05T12:46:36Z) - Physics-based Noise Modeling for Extreme Low-light Photography [63.65570751728917]
CMOS光センサの撮像パイプラインにおけるノイズ統計について検討する。
実雑音構造を正確に特徴付けることのできる包括的ノイズモデルを定式化する。
我々のノイズモデルは、学習に基づく低照度復調アルゴリズムのためのリアルなトレーニングデータを合成するのに利用できる。
論文 参考訳(メタデータ) (2021-08-04T16:36:29Z) - Neighbor2Neighbor: Self-Supervised Denoising from Single Noisy Images [98.82804259905478]
Neighbor2Neighborを提示し、ノイズの多い画像のみで効果的な画像消音モデルをトレーニングします。
ネットワークのトレーニングに使用される入力とターゲットは、同じノイズ画像からサブサンプリングされた画像である。
デノイジングネットワークは、第1段階で生成されたサブサンプルトレーニングペアで訓練され、提案された正規化器は、より良いパフォーマンスのための追加の損失として訓練される。
論文 参考訳(メタデータ) (2021-01-08T02:03:25Z) - Progressive Training of Multi-level Wavelet Residual Networks for Image
Denoising [80.10533234415237]
本稿では,マルチレベルウェーブレット残差ネットワーク(MWRN)アーキテクチャと,画像復調性能向上のためのプログレッシブトレーニング手法を提案する。
人工ノイズ画像と実世界のノイズ画像の両方で実験したところ、PT-MWRNは最先端のノイズ評価法に対して良好に機能することがわかった。
論文 参考訳(メタデータ) (2020-10-23T14:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。