論文の概要: Optical Diffusion Models for Image Generation
- arxiv url: http://arxiv.org/abs/2407.10897v2
- Date: Thu, 31 Oct 2024 10:01:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 21:32:38.043471
- Title: Optical Diffusion Models for Image Generation
- Title(参考訳): 画像生成のための光拡散モデル
- Authors: Ilker Oguz, Niyazi Ulas Dinc, Mustafa Yildirim, Junjie Ke, Innfarn Yoo, Qifei Wang, Feng Yang, Christophe Moser, Demetri Psaltis,
- Abstract要約: 拡散モデルは、初期供給されたランダム分布から徐々にノイズを減らし、新しいサンプルを生成する。
この推論手順は、トレーニングされたニューラルネットワークを何回も使用して最終的な出力を得るのが一般的である。
本研究では,半透明媒質を透過する光ビームの伝搬をプログラムし,画像サンプルにデノナイズ拡散モデルを実装することを実証する。
- 参考スコア(独自算出の注目度): 8.91748872686524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models generate new samples by progressively decreasing the noise from the initially provided random distribution. This inference procedure generally utilizes a trained neural network numerous times to obtain the final output, creating significant latency and energy consumption on digital electronic hardware such as GPUs. In this study, we demonstrate that the propagation of a light beam through a semi-transparent medium can be programmed to implement a denoising diffusion model on image samples. This framework projects noisy image patterns through passive diffractive optical layers, which collectively only transmit the predicted noise term in the image. The optical transparent layers, which are trained with an online training approach, backpropagating the error to the analytical model of the system, are passive and kept the same across different steps of denoising. Hence this method enables high-speed image generation with minimal power consumption, benefiting from the bandwidth and energy efficiency of optical information processing.
- Abstract(参考訳): 拡散モデルは、初期供給されたランダム分布から徐々にノイズを減らし、新しいサンプルを生成する。
この推論手順は一般に、トレーニングされたニューラルネットワークを何度も使用して最終的な出力を取得し、GPUのようなデジタル電子ハードウェア上で大きなレイテンシとエネルギー消費を生み出す。
本研究では,半透明媒質を透過する光ビームの伝搬をプログラムし,画像サンプルにデノナイズ拡散モデルを実装することを実証する。
このフレームワークは、受動回折光学層を通してノイズの多い画像パターンを投影し、予測された雑音項のみを画像中に送信する。
オンライントレーニングアプローチでトレーニングされた光学透明層は、システムの分析モデルにエラーをバックプロパゲートして受動的に処理し、異なる段階の認知処理を行う。
これにより、光情報処理の帯域幅とエネルギー効率の恩恵を受け、最小消費電力で高速な画像生成が可能となる。
関連論文リスト
- Ultrasound Image Enhancement with the Variance of Diffusion Models [7.360352432782388]
超音波画像の強調にはコントラスト、解像度、スペックル保存の微妙なバランスが必要である。
本稿では,適応ビームフォーミングと拡散型分散イメージングを併用した新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-17T17:29:33Z) - Sequential Posterior Sampling with Diffusion Models [15.028061496012924]
条件付き画像合成における逐次拡散後サンプリングの効率を向上させるため,遷移力学をモデル化する新しい手法を提案する。
本研究では,高フレームレート心エコー画像の現実的データセットに対するアプローチの有効性を実証する。
提案手法は,画像の拡散モデルとリアルタイム推論を必要とする他の領域における拡散モデルのリアルタイム適用の可能性を開く。
論文 参考訳(メタデータ) (2024-09-09T07:55:59Z) - Blue noise for diffusion models [50.99852321110366]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。
我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。
本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文 参考訳(メタデータ) (2024-02-07T14:59:25Z) - LDM-ISP: Enhancing Neural ISP for Low Light with Latent Diffusion Models [54.93010869546011]
本稿では,事前学習した潜伏拡散モデルを用いて,超低照度画像の高精細化のためのニューラルISPを実現することを提案する。
具体的には、RAWドメイン上で動作するために事前訓練された潜在拡散モデルを調整するために、軽量なテーミングモジュールのセットをトレーニングする。
遅延拡散モデルにおけるUNet復調と復号化の異なる役割を観察し、低照度画像強調タスクを遅延空間低周波コンテンツ生成と復号位相高周波ディテール保守に分解するきっかけとなる。
論文 参考訳(メタデータ) (2023-12-02T04:31:51Z) - All-optical image denoising using a diffractive visual processor [0.0]
入力画像から様々な形態のノイズやアーティファクトを全光学的および非定性的に清浄するアナログ回折画像デノイザを提案する。
以上の結果から,これらの回折デノイザは,入力位相や強度画像から塩と唐辛子ノイズや画像レンダリング関連空間アーチファクトを効率よく除去できることがわかった。
速度、電力効率、計算オーバーヘッドの最小化により、全光回折デノイザは様々な画像表示や投影システムに対して変換可能である。
論文 参考訳(メタデータ) (2023-09-17T08:54:50Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - Image Denoising and the Generative Accumulation of Photons [63.14988413396991]
我々は,次の光子がどこに到着できるかを予測するために訓練されたネットワークが,実際に最小平均二乗誤差(MMSE)を解くことを示している。
自己監督型認知のための新しい戦略を提案する。
本稿では,画像に少量の光子を反復的にサンプリングし,付加することにより,可能な解の後方からサンプリングする新しい方法を提案する。
論文 参考訳(メタデータ) (2023-07-13T08:03:32Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Real-World Denoising via Diffusion Model [14.722529440511446]
実世界のイメージデノイングは、自然の環境で撮影されたノイズの多い画像からクリーンなイメージを復元することを目的としている。
拡散モデルは画像生成の分野で非常に有望な結果を得た。
本稿では,実世界の画像のデノナイズに使用可能な,新しい一般デノナイズ拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-05-08T04:48:03Z) - Q-Diffusion: Quantizing Diffusion Models [52.978047249670276]
ポストトレーニング量子化(PTQ)は、他のタスクに対するゴーツー圧縮法であると考えられている。
本稿では,一意なマルチステップパイプラインとモデルアーキテクチャに適した新しいPTQ手法を提案する。
提案手法は,完全精度の非条件拡散モデルを同等の性能を維持しつつ4ビットに定量化できることを示す。
論文 参考訳(メタデータ) (2023-02-08T19:38:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。