論文の概要: PixelPyramids: Exact Inference Models from Lossless Image Pyramids
- arxiv url: http://arxiv.org/abs/2110.08787v1
- Date: Sun, 17 Oct 2021 10:47:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 15:35:24.106166
- Title: PixelPyramids: Exact Inference Models from Lossless Image Pyramids
- Title(参考訳): pixelpyramids:ロスレス画像ピラミッドによる正確な推論モデル
- Authors: Shweta Mahajan, Stefan Roth
- Abstract要約: Pixel-Pyramidsは、画像画素の関節分布を符号化するスケール特異的表現を用いたブロック自動回帰手法である。
様々な画像データセット、特に高解像度データに対する密度推定の最先端結果が得られる。
CelebA-HQ 1024 x 1024 では,フローベースモデルの並列化よりもサンプリング速度が優れているにもかかわらず,密度推定値がベースラインの 44% に向上することが観察された。
- 参考スコア(独自算出の注目度): 58.949070311990916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoregressive models are a class of exact inference approaches with highly
flexible functional forms, yielding state-of-the-art density estimates for
natural images. Yet, the sequential ordering on the dimensions makes these
models computationally expensive and limits their applicability to
low-resolution imagery. In this work, we propose Pixel-Pyramids, a
block-autoregressive approach employing a lossless pyramid decomposition with
scale-specific representations to encode the joint distribution of image
pixels. Crucially, it affords a sparser dependency structure compared to fully
autoregressive approaches. Our PixelPyramids yield state-of-the-art results for
density estimation on various image datasets, especially for high-resolution
data. For CelebA-HQ 1024 x 1024, we observe that the density estimates (in
terms of bits/dim) are improved to ~44% of the baseline despite sampling speeds
superior even to easily parallelizable flow-based models.
- Abstract(参考訳): 自己回帰モデル(autoregressive models)は、高度に柔軟な機能形式を持つ正確な推論アプローチのクラスであり、自然画像に対する最先端の密度推定をもたらす。
しかし、次元の逐次順序付けによってこれらのモデルは計算コストが高くなり、低解像度画像への適用性が制限される。
本研究では,画像画素の結合分布を符号化するために,スケール固有表現を用いたロスレスピラミッド分解を用いたブロック自己回帰手法であるpixel-pyramidsを提案する。
重要なことは、完全に自己回帰的なアプローチに比べて、スペーサーの依存関係構造を持つ。
我々のPixelPyramidsは様々な画像データセット、特に高解像度データの密度推定に最先端の結果をもたらす。
CelebA-HQ 1024 x 1024では, 並列化可能なフローベースモデルよりもサンプリング速度が優れているにもかかわらず, 密度推定(ビット/ディム)がベースラインの約44%に改善されている。
関連論文リスト
- Fast constrained sampling in pre-trained diffusion models [77.21486516041391]
拡散モデルは、大規模な生成画像モデルの分野を支配してきた。
本研究では,大規模な事前学習拡散モデルにおける高速拘束サンプリングのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - Real-World Efficient Blind Motion Deblurring via Blur Pixel Discretization [45.20189929583484]
我々は,デブロアリング(回帰)タスクを,画素の離散化と離散連続変換タスクに分解する。
具体的には,ぼやけた画素を識別して画像残差誤差を生成し,連続的な形状に変換する。
論文 参考訳(メタデータ) (2024-04-18T13:22:56Z) - Deep Richardson-Lucy Deconvolution for Low-Light Image Deblurring [48.80983873199214]
我々は,飽和画素を学習潜時マップでモデル化するデータ駆動型手法を開発した。
新しいモデルに基づいて、非盲検除色タスクを最大後部(MAP)問題に定式化することができる。
増幅されたアーティファクトを使わずに高品質な劣化画像を推定するために,我々は事前推定ネットワークを構築した。
論文 参考訳(メタデータ) (2023-08-10T12:53:30Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z) - Weighted Encoding Based Image Interpolation With Nonlocal Linear
Regression Model [8.013127492678272]
超高解像度画像では、低解像度画像は、ぼやけやノイズを伴わずに、その高解像度画像から直接ダウンサンプリングされる。
この問題に対処するために,スパース表現に基づく新しい画像モデルを提案する。
クラスタリングではなく、オンラインの適応サブ辞書を学習するための新しいアプローチ。
論文 参考訳(メタデータ) (2020-03-04T03:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。