論文の概要: PixelBoost: Leveraging Brownian Motion for Realistic-Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2506.23254v1
- Date: Sun, 29 Jun 2025 14:22:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.789994
- Title: PixelBoost: Leveraging Brownian Motion for Realistic-Image Super-Resolution
- Title(参考訳): PixelBoost:リアル画像の超解像のためのブラウン運動の活用
- Authors: Aradhana Mishra, Bumshik Lee,
- Abstract要約: 拡散モデルに基づく画像超解像技術は、しばしば現実的な画像生成と計算効率のトレードオフに直面している。
我々は,ブラウン運動の性質を受け入れることの重要性を浮き彫りにする新しい拡散モデル PixelBoost を紹介する。
提案モデルでは,学習された知覚的イメージパッチ類似度 (LPIPS), 順序誤差 (LOE), ピーク信号-雑音比 (PSNR), 構造的類似度指標 (SSIM) および視覚的品質の観点から,より優れた客観的結果を示す。
- 参考スコア(独自算出の注目度): 8.041659727964305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion-model-based image super-resolution techniques often face a trade-off between realistic image generation and computational efficiency. This issue is exacerbated when inference times by decreasing sampling steps, resulting in less realistic and hazy images. To overcome this challenge, we introduce a novel diffusion model named PixelBoost that underscores the significance of embracing the stochastic nature of Brownian motion in advancing image super-resolution, resulting in a high degree of realism, particularly focusing on texture and edge definitions. By integrating controlled stochasticity into the training regimen, our proposed model avoids convergence to local optima, effectively capturing and reproducing the inherent uncertainty of image textures and patterns. Our proposed model demonstrates superior objective results in terms of learned perceptual image patch similarity (LPIPS), lightness order error (LOE), peak signal-to-noise ratio(PSNR), structural similarity index measure (SSIM), as well as visual quality. To determine the edge enhancement, we evaluated the gradient magnitude and pixel value, and our proposed model exhibited a better edge reconstruction capability. Additionally, our model demonstrates adaptive learning capabilities by effectively adjusting to Brownian noise patterns and introduces a sigmoidal noise sequencing method that simplifies training, resulting in faster inference speeds.
- Abstract(参考訳): 拡散モデルに基づく画像超解像技術は、しばしば現実的な画像生成と計算効率のトレードオフに直面している。
この問題はサンプリングステップを減らして推測時間を短縮することで悪化し、現実的な画像がより少なくなる。
この課題を克服するために、PixelBoostという新しい拡散モデルを導入し、特にテクスチャやエッジ定義に焦点をあてた、画像超解像の進行におけるブラウン運動の確率的性質を受け入れることの重要性を強調した。
制御された確率性をトレーニングレギュラーに組み込むことで,画像テクスチャやパターンの固有の不確かさを効果的に把握・再現し,局所最適への収束を回避することができる。
提案モデルでは,学習された知覚的イメージパッチ類似度(LPIPS),光度順序誤差(LOE),ピーク信号-雑音比(PSNR),構造的類似度指標(SSIM),視覚的品質の観点から,より優れた客観的結果を示す。
エッジエンハンスメント(エッジエンハンスメント,エッジエンハンスメント)を決定するため,勾配等級と画素値を評価し,より優れたエッジ再構成能力を示した。
さらに、ブラウン雑音パターンを効果的に調整することで適応学習能力を示し、訓練を簡略化し、推論速度を高速化するシグモダルノイズシーケンシング手法を導入する。
関連論文リスト
- DPEC: Dual-Path Error Compensation Method for Enhanced Low-Light Image Clarity [2.8161423494191222]
低照度条件下での画質向上のためのDual-Path Error Compensation (DPEC)法を提案する。
DPECには、微妙な違いを捉えるための正確なピクセルレベルの誤差推定と、ノイズ増幅を防ぐための独立したデノナイジング機構が組み込まれている。
総合的な定量的および定性的実験結果から,このアルゴリズムは低照度画像強調における最先端手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-06-28T08:21:49Z) - BAGS: Blur Agnostic Gaussian Splatting through Multi-Scale Kernel Modeling [32.493592776662005]
様々な画像のぼかしに対するガウススプティングに基づく手法の頑健さを解析する。
この問題に対処するためにBlur Agnostic Gaussian Splatting (BAGS)を提案する。
BAGSは、画像がぼやけているにもかかわらず、3D一貫性と高品質なシーンを再構築できる2Dモデリング能力を導入している。
論文 参考訳(メタデータ) (2024-03-07T22:21:08Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.04220377034574]
高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。
本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。
我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文 参考訳(メタデータ) (2023-06-23T18:08:00Z) - Perception-Distortion Balanced ADMM Optimization for Single-Image
Super-Resolution [29.19388490351459]
低周波制約(LFc-SR)を持つ新しい超解像モデルを提案する。
制約付きモデルの非自明な学習のためのADMMに基づく交互最適化手法を提案する。
実験の結果,提案手法は加工後処理の煩雑さを伴わず,最先端の性能を達成できた。
論文 参考訳(メタデータ) (2022-08-05T05:37:55Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z) - Designing a Practical Degradation Model for Deep Blind Image
Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。
本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文 参考訳(メタデータ) (2021-03-25T17:40:53Z) - Learning Spatial and Spatio-Temporal Pixel Aggregations for Image and
Video Denoising [104.59305271099967]
ピクセル集計ネットワークを提示し、画像デノイジングのためのピクセルサンプリングと平均戦略を学びます。
時間空間にまたがるサンプル画素をビデオデノナイズするための画素集約ネットワークを開発した。
本手法は,動的シーンにおける大きな動きに起因する誤認問題を解決することができる。
論文 参考訳(メタデータ) (2021-01-26T13:00:46Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。