論文の概要: Degradation-Modeled Multipath Diffusion for Tunable Metalens Photography
- arxiv url: http://arxiv.org/abs/2506.22753v1
- Date: Sat, 28 Jun 2025 04:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.548159
- Title: Degradation-Modeled Multipath Diffusion for Tunable Metalens Photography
- Title(参考訳): 可変金属写真のための劣化モデルによるマルチパス拡散
- Authors: Jianing Zhang, Jiayi Zhu, Feiyu Ji, Xiaokang Yang, Xiaoyun Yuan,
- Abstract要約: 調光性メタレン写真のための劣化モデル多経路拡散法について紹介する。
我々は, 高周波詳細生成, 構造忠実度, メタレン特異的劣化抑制のバランスをとる。
実世界の検証のために,ミリスケールのMetaCameraを構築した。
- 参考スコア(独自算出の注目度): 44.164180405913456
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Metalenses offer significant potential for ultra-compact computational imaging but face challenges from complex optical degradation and computational restoration difficulties. Existing methods typically rely on precise optical calibration or massive paired datasets, which are non-trivial for real-world imaging systems. Furthermore, a lack of control over the inference process often results in undesirable hallucinated artifacts. We introduce Degradation-Modeled Multipath Diffusion for tunable metalens photography, leveraging powerful natural image priors from pretrained models instead of large datasets. Our framework uses positive, neutral, and negative-prompt paths to balance high-frequency detail generation, structural fidelity, and suppression of metalens-specific degradation, alongside \textit{pseudo} data augmentation. A tunable decoder enables controlled trade-offs between fidelity and perceptual quality. Additionally, a spatially varying degradation-aware attention (SVDA) module adaptively models complex optical and sensor-induced degradation. Finally, we design and build a millimeter-scale MetaCamera for real-world validation. Extensive results show that our approach outperforms state-of-the-art methods, achieving high-fidelity and sharp image reconstruction. More materials: https://dmdiff.github.io/.
- Abstract(参考訳): メタセンスは、超コンパクトな計算イメージングには大きな可能性を秘めているが、複雑な光学劣化と計算回復の難しさに直面する。
既存の手法は通常、正確な光学キャリブレーションや大量のペアデータセットに依存しており、これは現実世界のイメージングシステムではさほど簡単ではない。
さらに、推論プロセスに対する制御の欠如は、しばしば好ましくない幻覚的アーティファクトをもたらす。
大規模データセットではなく,事前学習したモデルからの強力な自然画像の事前処理を生かした,可変メタレンス撮影のための劣化モデル型マルチパス拡散法を提案する。
当社のフレームワークでは,高頻度詳細生成,構造忠実度,メタレン特異的劣化の抑制,および<textit{pseudo}データ増大のバランスをとるために,正・中・負の経路を用いる。
チューナブルデコーダは、忠実度と知覚品質のトレードオフを制御することができる。
さらに、空間的に変化する劣化注意(SVDA)モジュールは、複雑な光学的およびセンサーによる劣化を適応的にモデル化する。
最後に,実世界の検証のために,ミリスケールのMetaCameraを設計・構築する。
その結果,本手法は高忠実度,鮮明な画像再構成を実現し,最先端の手法よりも優れていた。
詳しくは、https://dmdiff.github.io/を参照。
関連論文リスト
- LensNet: An End-to-End Learning Framework for Empirical Point Spread Function Modeling and Lensless Imaging Reconstruction [32.85180149439811]
レンズレスイメージングは、従来のレンズベースのシステムに代わる有望な選択肢である。
従来のレンズレス技術は、しばしば明示的な校正と広範な前処理を必要とする。
本研究では,空間領域と周波数領域の表現を統合したエンドツーエンドのディープラーニングフレームワークであるLensNetを提案する。
論文 参考訳(メタデータ) (2025-05-03T09:11:52Z) - FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。
既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。
実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:08:40Z) - AoSRNet: All-in-One Scene Recovery Networks via Multi-knowledge
Integration [17.070755601209136]
マルチ知識統合によるオールインワンシーン復元ネットワーク(AoSRNet)を提案する。
ガンマ補正(GC)と最適化線形ストレッチ(OLS)を組み合わせてディテール拡張モジュール(DEM)とカラー復元モジュール(CRM)を作成する。
総合的な実験結果から,AoSRNetの有効性と安定性が他の最先端手法と比較された。
論文 参考訳(メタデータ) (2024-02-06T06:12:03Z) - Neural Invertible Variable-degree Optical Aberrations Correction [6.6855248718044225]
本稿では,その情報ロスレス特性を利用して,可逆的アーキテクチャを用いた新しい収差補正手法を提案する。
アーキテクチャ内では、可変度で収差を処理できる条件付き可逆ブロックを開発する。
本手法は,物理画像シミュレーションによる合成データセットと実捕集データセットの両方を用いて評価する。
論文 参考訳(メタデータ) (2023-04-12T01:56:42Z) - DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:05:18Z) - A Trainable Spectral-Spatial Sparse Coding Model for Hyperspectral Image
Restoration [36.525810477650026]
ハイパースペクトルイメージングは様々な用途に新しい視点を提供する。
地上に正確な「クリーン」ハイパースペクトル信号がないため、修復作業は困難である。
本稿では、疎結合な符号化原理に基づくハイブリッドアプローチを提唱する。
論文 参考訳(メタデータ) (2021-11-18T14:16:04Z) - DA-DRN: Degradation-Aware Deep Retinex Network for Low-Light Image
Enhancement [14.75902042351609]
低照度画像強調のための劣化対応深部網膜ネットワーク(DA-DRN)を提案する。
Retinex Theoryに基づいて、我々のモデルにおける分解ネットは、低照度画像を反射率と照明マップに分解することができる。
提案手法は, 良好なルバスト性および一般化によって有望な効果を発揮することを示すため, 広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-10-05T03:53:52Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。