論文の概要: Enhancing Neural Autoregressive Distribution Estimators for Image Reconstruction
- arxiv url: http://arxiv.org/abs/2506.05391v1
- Date: Tue, 03 Jun 2025 18:44:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.120515
- Title: Enhancing Neural Autoregressive Distribution Estimators for Image Reconstruction
- Title(参考訳): 画像再構成のためのニューラル自己回帰分布推定器の強化
- Authors: Ambrose Emmett-Iwaniw, Nathan Kirk,
- Abstract要約: 画像の小さな部分集合(画素パッチと呼ばれる)を観察して、画像の未観測部分を予測するという課題について検討する。
本研究では,畳み込み型自己回帰分布推定器(ConvNADE)モデルの一般化と計算効率のよいバージョンを提案する。
ベンチマークデータセットの実験では、低差分シーケンスに類似したピクセルの選択がテスト損失を減少させ、よりリアルに再構成された画像を生成することが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoregressive models are often employed to learn distributions of image data by decomposing the $D$-dimensional density function into a product of one-dimensional conditional distributions. Each conditional depends on preceding variables (pixels, in the case of image data), making the order in which variables are processed fundamental to the model performance. In this paper, we study the problem of observing a small subset of image pixels (referred to as a pixel patch) to predict the unobserved parts of the image. As our prediction mechanism, we propose a generalized and computationally efficient version of the convolutional neural autoregressive distribution estimator (ConvNADE) model adapted for real-valued and color images. Moreover, we investigate the quality of image reconstruction when observing both random pixel patches and low-discrepancy pixel patches inspired by quasi-Monte Carlo theory. Experiments on benchmark datasets demonstrate that choosing the pixels akin to a low-discrepancy sequence reduces test loss and produces more realistic reconstructed images.
- Abstract(参考訳): 自己回帰モデルはしばしば、1次元条件分布の積に$D$次元密度関数を分解することで画像データの分布を学習するために用いられる。
各条件は、先行する変数(画像データの場合はピクセル)に依存し、変数がモデルの性能に基礎的に処理される順序となる。
本稿では、画像の未観測部分を予測するために、画像画素の小さな部分集合(画素パッチと呼ばれる)を観察する問題について検討する。
本研究では,畳み込み型自己回帰分布推定器(ConvNADE)モデルの一般化と計算効率のよいモデルを提案する。
さらに,準モンテカルロ理論に着想を得たランダム画素パッチと低分解能画素パッチの両方を観察する際の画像再構成の品質について検討した。
ベンチマークデータセットの実験では、低差分シーケンスに類似したピクセルの選択がテスト損失を減少させ、よりリアルに再構成された画像を生成することが示されている。
関連論文リスト
- Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Uncertainty Quantification via Neural Posterior Principal Components [26.26693707762823]
不確実性定量化は、画像復元モデルの安全クリティカルドメインへの展開に不可欠である。
本稿では,入力画像の後方分布のPCをニューラルネットワークの単一前方通過で予測する手法を提案する。
提案手法は, インスタンス適応型不確実性方向を確実に伝達し, 後部サンプリングに匹敵する不確実性定量化を実現する。
論文 参考訳(メタデータ) (2023-09-27T09:51:29Z) - Lossy Image Compression with Conditional Diffusion Models [25.158390422252097]
本稿では,拡散生成モデルを用いた画像圧縮のエンドツーエンド最適化について概説する。
VAEベースのニューラル圧縮とは対照的に、(平均)デコーダは決定論的ニューラルネットワークであり、私たちのデコーダは条件付き拡散モデルである。
提案手法では,GANモデルよりもFIDスコアが強く,VAEモデルとの競合性能も高い。
論文 参考訳(メタデータ) (2022-09-14T21:53:27Z) - Learning the Degradation Distribution for Blind Image Super-Resolution [43.95832398891317]
本稿では,確率分解モデル (PDM) を提案する。
PDMはより多様な劣化をモデル化し、試験画像の様々な劣化をよりよくカバーするHR-LRペアを生成することができる。
論文 参考訳(メタデータ) (2022-03-09T11:30:38Z) - PixelPyramids: Exact Inference Models from Lossless Image Pyramids [58.949070311990916]
Pixel-Pyramidsは、画像画素の関節分布を符号化するスケール特異的表現を用いたブロック自動回帰手法である。
様々な画像データセット、特に高解像度データに対する密度推定の最先端結果が得られる。
CelebA-HQ 1024 x 1024 では,フローベースモデルの並列化よりもサンプリング速度が優れているにもかかわらず,密度推定値がベースラインの 44% に向上することが観察された。
論文 参考訳(メタデータ) (2021-10-17T10:47:29Z) - Low-Light Image Enhancement with Normalizing Flow [92.52290821418778]
本稿では,この一対多の関係を正規化フローモデルを用いてモデル化する。
低照度画像/特徴を条件として取り、通常露光される画像の分布をガウス分布にマッピングすることを学ぶ可逆ネットワーク。
既存のベンチマークデータセットによる実験結果から,提案手法はより定量的,質的な結果を得ることができ,照度が良く,ノイズやアーティファクトが小さく,色も豊かになることがわかった。
論文 参考訳(メタデータ) (2021-09-13T12:45:08Z) - Image Inpainting with Learnable Feature Imputation [8.293345261434943]
正規畳み込み層は、未知の領域にフィルターを適用するのと同じ方法で、塗装された画像の視覚的アーティファクトを引き起こす。
本稿では,欠落した入力値の畳み込みに対する(階層的な)特徴計算を提案する。
我々はCelebA-HQとPlaces2を比較し,そのモデルを検証する。
論文 参考訳(メタデータ) (2020-11-02T16:05:32Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。