論文の概要: ShuffleFlow: Scalable Posterior Inference for Bayesian Inverse Imaging
- arxiv url: http://arxiv.org/abs/2606.21099v1
- Date: Fri, 19 Jun 2026 04:59:16 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:30:02.097976
- Title: ShuffleFlow: Scalable Posterior Inference for Bayesian Inverse Imaging
- Title(参考訳): ShuffleFlow:ベイズ逆画像のためのスケーラブルな後部推論
- Authors: Tianao Li, Tjitske Starkenburg, Yu Sun, Emma Alexander,
- Abstract要約: 変分推論(VI)は科学的逆画像の原理的後部推論の強力な方法である。
この課題に対処するためのスケーラブルなVIフレームワークであるShuffleFlowを紹介します。
- 参考スコア(独自算出の注目度): 4.497683654789124
- License:
- Abstract: Variational inference (VI) is a powerful method for principled posterior inference for scientific inverse imaging. VI learns the posterior distribution, often with a flow-based network, which can cheaply generate posterior samples upon optimization, and can flexibly incorporate score-based or classic priors. However, its application to large-scale image reconstruction is severely hindered by the poor scalability of the flow-based networks. In this work, we introduce ShuffleFlow, a scalable VI framework to address this challenge. Our method breaks down the problem into three parts: a pixel-unshuffling-based image coordinate sampler, a neural field as feature encoder, and a conditional normalizing flow (CNF) as posterior estimator. Specifically, our framework partitions an image into a stack of sub-images with pixel-unshuffling and uses a shared CNF to model the joint distribution of the sub-image stack. We condition the CNF on the output of a neural field, which embeds feature vectors corresponding to pixel-unshuffling sample locations to capture spatial structures, and share the flow's latent variable across the channels to model their correlations. We demonstrate our method's effectiveness and efficiency on both linear and nonlinear imaging inverse problems, and show its ability to more rapidly generate a high-sample-count posterior than diffusion samplers.
- Abstract(参考訳): 変分推論(VI)は科学的逆画像の原理的後部推論の強力な方法である。
VIは、しばしばフローベースのネットワークで後部分布を学習し、最適化時に低コストで後部サンプルを生成でき、スコアベースまたは古典的な先行を柔軟に組み込むことができる。
しかし,その大規模画像再構成への応用は,フローベースネットワークのスケーラビリティの低下によって著しく阻害されている。
この課題に対処するためのスケーラブルなVIフレームワークであるShuffleFlowを紹介します。
本手法では,画素アンシャッフルに基づく画像座標サンプリング器,特徴エンコーダとしてのニューラルフィールド,後部推定器としての条件正規化フロー(CNF)の3つの部分に分割する。
具体的には、画像をピクセルアンシャッフルでサブイメージのスタックに分割し、共有CNFを用いてサブイメージスタックの結合分布をモデル化する。
我々は、CNFを、画素アンシャッフルするサンプル位置に対応する特徴ベクトルを埋め込んで空間構造を捉え、チャネル全体にわたって流れの潜伏変数を共有して相関関係をモデル化するニューラルネットワークの出力に条件付けする。
線形画像逆問題と非線形画像逆問題の両方において,本手法の有効性と効率を実証し,拡散サンプリング器よりも高速に後方値を生成する能力を示した。
関連論文リスト
- LeDiFlow: Learned Distribution-guided Flow Matching to Accelerate Image Generation [1.1847464266302488]
Flow Matching(FM)は、DMで使用されるスコアベースではなく、シミュレーションなしのトレーニング目標に基づく強力な生成モデリングパラダイムである。
本稿では,FMベースの画像生成モデルを学習するための新しいスケーラブルな手法であるLearted Distribution-guided Flow Matching(LeDiFlow)を提案する。
提案手法では,ステートオフ・ザ・アルト (SOTA) トランスフォーマーアーキテクチャと遅延空間サンプリングを併用し,コンシューマー向けワークステーションでトレーニングを行う。
論文 参考訳(メタデータ) (2025-05-27T05:07:37Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - Provably Robust Score-Based Diffusion Posterior Sampling for Plug-and-Play Image Reconstruction [31.503662384666274]
科学と工学において、ゴールは、ある画像のモダリティを記述する既知のフォワードモデルから収集された少数の測定値から未知の画像を推測することである。
モチベートされたスコアベース拡散モデルはその経験的成功により、画像再構成に先立って模範の印象的な候補として現れた。
論文 参考訳(メタデータ) (2024-03-25T15:58:26Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - Squeeze flow of micro-droplets: convolutional neural network with
trainable and tunable refinement [0.0]
本論文の前半では,問題の基礎となる物理を定式化するための偏微分方程式について述べる。
このパッケージは、機械学習やコンピュータビジョンの分野で、自由でフレキシブルでスケーラブルな標準ベンチマークとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-11-16T17:22:46Z) - FewGAN: Generating from the Joint Distribution of a Few Images [95.6635227371479]
本稿では,新しい,高品質で多様な画像を生成するための生成モデルFewGANを紹介する。
FewGANは、第1の粗いスケールで量子化を適用した階層的なパッチGANであり、その後、より微細なスケールで残った完全畳み込みGANのピラミッドが続く。
大規模な実験では、FewGANは定量的にも定性的にも基線より優れていることが示されている。
論文 参考訳(メタデータ) (2022-07-18T07:11:28Z) - 3D Human Pose and Shape Regression with Pyramidal Mesh Alignment
Feedback Loop [128.07841893637337]
回帰に基づく手法は最近、単眼画像からヒトのメッシュを再構成する有望な結果を示した。
パラメータの小さな偏差は、推定メッシュと画像のエビデンスの間に顕著な不一致を引き起こす可能性がある。
本稿では,特徴ピラミッドを活用し,予測パラメータを補正するために,ピラミッドメッシュアライメントフィードバック(pymaf)ループを提案する。
論文 参考訳(メタデータ) (2021-03-30T17:07:49Z) - Image Inpainting with Learnable Feature Imputation [8.293345261434943]
正規畳み込み層は、未知の領域にフィルターを適用するのと同じ方法で、塗装された画像の視覚的アーティファクトを引き起こす。
本稿では,欠落した入力値の畳み込みに対する(階層的な)特徴計算を提案する。
我々はCelebA-HQとPlaces2を比較し,そのモデルを検証する。
論文 参考訳(メタデータ) (2020-11-02T16:05:32Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。