論文の概要: Deep Unfolded BM3D: Unrolling Non-local Collaborative Filtering into a Trainable Neural Network
- arxiv url: http://arxiv.org/abs/2511.12248v1
- Date: Sat, 15 Nov 2025 15:06:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.700073
- Title: Deep Unfolded BM3D: Unrolling Non-local Collaborative Filtering into a Trainable Neural Network
- Title(参考訳): 深部展開型BM3D:非局所協調フィルタリングをトレーニング可能なニューラルネットワークに展開する
- Authors: Kerem Basim, Mehmet Ozan Unal, Metin Ertas, Isa Yildirim,
- Abstract要約: BM3Dは、非局所的な自己相似性プリミティブをデノナイジングに利用しているが、固定パラメータに依存している。
U-Netのような深層モデルはより柔軟であるが、解釈可能性に欠け、ノイズレシエーションをまたいだ一般化に失敗することが多い。
我々は,BM3Dを学習可能なU-Netデノイザに置き換えることで,BM3Dをトレーニング可能なアーキテクチャにアンロールするハイブリッドフレームワークであるDeep Unfolded BM3D(DU-BM3D)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Block-Matching and 3D Filtering (BM3D) exploits non-local self-similarity priors for denoising but relies on fixed parameters. Deep models such as U-Net are more flexible but often lack interpretability and fail to generalize across noise regimes. In this study, we propose Deep Unfolded BM3D (DU-BM3D), a hybrid framework that unrolls BM3D into a trainable architecture by replacing its fixed collaborative filtering with a learnable U-Net denoiser. This preserves BM3D's non-local structural prior while enabling end-to-end optimization. We evaluate DU-BM3D on low-dose CT (LDCT) denoising and show that it outperforms classic BM3D and standalone U-Net across simulated LDCT at different noise levels, yielding higher PSNR and SSIM, especially in high-noise conditions.
- Abstract(参考訳): Block-Matching and 3D Filtering (BM3D)は、非局所的な自己相似性プリミティブをデノナイズに利用しているが、固定パラメータに依存している。
U-Netのような深層モデルはより柔軟であるが、解釈可能性に欠け、ノイズレシエーションをまたいだ一般化に失敗することが多い。
本研究では,BM3Dを学習可能なU-Netデノイザに置き換えることで,BM3Dをトレーニング可能なアーキテクチャにアンロールするハイブリッドフレームワークであるDeep Unfolded BM3D(DU-BM3D)を提案する。
これはBM3Dの非局所構造を保存し、エンドツーエンドの最適化を可能にする。
低用量CT(LDCT)によるDU-BM3Dの評価を行い,特に高雑音条件下では従来のBM3DとスタンドアロンのU-Netを異なる雑音レベルで比較し,PSNRとSSIMが上昇することを示した。
関連論文リスト
- Extreme Views: 3DGS Filter for Novel View Synthesis from Out-of-Distribution Camera Poses [3.007949058551534]
トレーニングデータ分布の外にカメラ位置から3Dガウススプラッティング(3DGS)モデルを見る場合、かなりの視覚ノイズが発生することが一般的である。
本稿では,この問題に対処する新しいリアルタイムレンダリング対応フィルタリング手法を提案する。
提案手法は,既存のNeRF(Neural Radiance Field)ベースのアプローチと比較して,視覚的品質,リアリズム,一貫性を著しく向上する。
論文 参考訳(メタデータ) (2025-10-22T21:09:16Z) - Robust Single-Stage Fully Sparse 3D Object Detection via Detachable Latent Diffusion [23.609914983496566]
Denoising Diffusion Probabilistic Models (DDPM) は堅牢な3Dオブジェクト検出タスクに成功している。
RSDNetというDDPMの分離可能な遅延フレームワーク(DLF)を備えたロバスト一段完全スパース3Dオブジェクト検出ネットワークを提案する。
論文 参考訳(メタデータ) (2025-08-05T09:30:39Z) - Learning Robust 3D Representation from CLIP via Dual Denoising [4.230780744307392]
私たちはCLIPから堅牢で一般化された3D表現を学習するための新しいフレームワークであるDual Denoisingを提案する。
3D事前トレーニングのための、デノナイジングベースのプロキシタスクと、新たな機能デノナイジングネットワークを組み合わせたものだ。
実験により,本モデルは3次元学習ネットワークの表現学習性能と対角的ロバスト性を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2024-07-01T02:15:03Z) - M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising [63.39134873744748]
既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
論文 参考訳(メタデータ) (2024-06-04T12:33:02Z) - Depth Map Denoising Network and Lightweight Fusion Network for Enhanced
3D Face Recognition [61.27785140017464]
本稿では,ノイズを低減するために,DIIF(Denoising Implicit Image Function)に基づくDMDNet(Depth Map Denoising Network)を提案する。
さらに,光深度と標準核融合ネットワーク(LDNFNet)と呼ばれる強力な認識ネットワークを設計し,異なるモード間の特徴と相補的特徴を学習する。
論文 参考訳(メタデータ) (2024-01-01T10:46:42Z) - Robust Deep Ensemble Method for Real-world Image Denoising [62.099271330458066]
そこで本研究では,実世界の画像認識のための単純なベイズディープアンサンブル(BDE)手法を提案する。
我々のBDEは、最先端の復調法よりも+0.28dBPSNRのゲインを達成している。
我々のBDEは他の画像復元タスクにも拡張でき、ベンチマークデータセット上で+0.30dB、+0.18dB、+0.12dB PSNRゲインを達成することができる。
論文 参考訳(メタデータ) (2022-06-08T06:19:30Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Non-local Recurrent Regularization Networks for Multi-view Stereo [108.17325696835542]
深層多視点ステレオネットワークでは、正確な深さ推定を実現するためにコスト正規化が不可欠である。
NR2-Netと呼ばれるマルチビューステレオのための新しい非局所リカレント正規化ネットワークを提案する。
提案手法は,DTU,タンク,テンプルの双方のデータセットに対して,最先端の再構築結果を実現する。
論文 参考訳(メタデータ) (2021-10-13T01:43:54Z) - BM3D vs 2-Layer ONN [27.660076041873687]
コンパクトニューラルネットワークは、AWGN画像復調のためのBM3Dと比較して、競合する結果を生み出すことができる。
その結果,最近提案されている,生成ニューロンモデル(self-onns)に基づく自己組織型ニューラルネットワークは,cnnよりも優れた選択肢ではないことがわかった。
論文 参考訳(メタデータ) (2021-03-04T14:37:23Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。