論文の概要: TM-BSN: Triangular-Masked Blind-Spot Network for Real-World Self-Supervised Image Denoising
- arxiv url: http://arxiv.org/abs/2604.04484v1
- Date: Mon, 06 Apr 2026 07:20:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.128891
- Title: TM-BSN: Triangular-Masked Blind-Spot Network for Real-World Self-Supervised Image Denoising
- Title(参考訳): TM-BSN: リアルタイム自己監督型画像デノーミングのための三角形型ブラインドスポットネットワーク
- Authors: Junyoung Park, Youngjin Oh, Nam Ik Cho,
- Abstract要約: ブラインドスポットネットワーク(BSN)は、ターゲット画素へのアクセスを防止し、自己監督された画像のデノナイズを可能にする。
本稿では,実sRGB雑音の空間的相関を正確にモデル化する新しい盲点アーキテクチャであるTriangular-Masked Blind-Spot Network (TM-BSN)を提案する。
提案手法は最先端の性能を達成し,既存の自己管理手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 22.77487319845247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blind-spot networks (BSNs) enable self-supervised image denoising by preventing access to the target pixel, allowing clean signal estimation without ground-truth supervision. However, this approach assumes pixel-wise noise independence, which is violated in real-world sRGB images due to spatially correlated noise from the camera's image signal processing (ISP) pipeline. While several methods employ downsampling to decorrelate noise, they alter noise statistics and limit the network's ability to utilize full contextual information. In this paper, we propose the Triangular-Masked Blind-Spot Network (TM-BSN), a novel blind-spot architecture that accurately models the spatial correlation of real sRGB noise. This correlation originates from demosaicing, where each pixel is reconstructed from neighboring samples with spatially decaying weights, resulting in a diamond-shaped pattern. To align the receptive field with this geometry, we introduce a triangular-masked convolution that restricts the kernel to its upper-triangular region, creating a diamond-shaped blind spot at the original resolution. This design excludes correlated pixels while fully leveraging uncorrelated context, eliminating the need for downsampling or post-processing. Furthermore, we use knowledge distillation to transfer complementary knowledge from multiple blind-spot predictions into a lightweight U-Net, improving both accuracy and efficiency. Extensive experiments on real-world benchmarks demonstrate that our method achieves state-of-the-art performance, significantly outperforming existing self-supervised approaches. Our code is available at https://github.com/parkjun210/TM-BSN.
- Abstract(参考訳): BSN(Blind-spot Network)は、ターゲット画素へのアクセスを防止し、地表面の監視なしにクリーンな信号推定を可能にする。
しかし,本手法では,映像信号処理(ISP)パイプラインの空間的相関ノイズにより,実世界のsRGB画像に違反する画素単位のノイズ独立性を仮定する。
いくつかの手法ではノイズをデコレーションするためにダウンサンプリングを用いるが、ノイズ統計を変更し、ネットワークの完全なコンテキスト情報を利用する能力を制限している。
本稿では,現実のsRGB雑音の空間的相関を正確にモデル化する,新しい盲点アーキテクチャであるTriangular-Masked Blind-Spot Network (TM-BSN)を提案する。
この相関関係は、各ピクセルが空間的に減衰する重みを持つ隣り合うサンプルから再構成され、ダイヤモンド形状のパターンが生じる分解に由来する。
この幾何と受容場を整合させるため、核を上三角領域に制限する三角行列畳み込みを導入し、元の解像度でダイヤモンド型盲点を形成する。
この設計では、相関画素を排除し、非相関コンテキストを完全に活用し、ダウンサンプリングや後処理の必要性を排除している。
さらに,複数の盲点予測からの補完的知識を軽量なU-Netに伝達し,精度と効率を向上する。
実世界のベンチマーク実験により,本手法が最先端の性能を達成し,既存の自己監督手法を著しく上回ることを示す。
私たちのコードはhttps://github.com/parkjun210/TM-BSNで利用可能です。
関連論文リスト
- Compressive sensing inspired self-supervised single-pixel imaging [48.79613794195208]
SISTA-Netは、単画素イメージングのための圧縮センシングインスパイアされた自己教師方式である。
我々は、適応スパース変換と学習可能なソフトスレッショルド演算子を組み合わせることで、潜伏領域に明示的な物理的間隔を課すために、ディープ非線形ネットワークを利用する。
複数のシミュレーションシナリオの実験では、SISTA-NetはPSNRの2.6dBで最先端の手法より優れていた。
論文 参考訳(メタデータ) (2026-03-31T13:31:43Z) - N-BVH: Neural ray queries with bounding volume hierarchies [51.430495562430565]
3Dコンピュータグラフィックスでは、シーンのメモリ使用量の大部分がポリゴンとテクスチャによるものである。
N-BVHは3次元の任意の光線クエリに応答するように設計されたニューラル圧縮アーキテクチャである。
本手法は, 視認性, 深度, 外観特性を忠実に近似する。
論文 参考訳(メタデータ) (2024-05-25T13:54:34Z) - ASCNet: Asymmetric Sampling Correction Network for Infrared Image Destriping [25.816984064145906]
非対称サンプリング補正ネットワーク(ASCNet)と呼ばれる新しい赤外画像デストリップ手法を提案する。
我々のASCNetは、Residual Haar Discrete Wavelet Transform (RHDWT), Pixel Shuffle (PS), Column Non-uniformity Correction Module (CNCM)の3つのコア要素で構成されています。
論文 参考訳(メタデータ) (2024-01-28T06:23:55Z) - Self-supervised Image Denoising with Downsampled Invariance Loss and
Conditional Blind-Spot Network [12.478287906337194]
ほとんどの代表的自己監督型デノイザーは盲点ネットワークに基づいている。
標準的な盲点ネットワークは、ノイズの画素ワイド相関により、実際のカメラノイズを低減できない。
実雑音を除去できる新しい自己教師型トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-19T08:55:27Z) - Exploring Efficient Asymmetric Blind-Spots for Self-Supervised Denoising in Real-World Scenarios [44.31657750561106]
実世界のシナリオにおけるノイズはしばしば空間的に相関しており、多くの自己教師型アルゴリズムは性能が良くない。
盲点サイズを自由に調整できる非対称可変ブラインド・スポットネットワーク(AT-BSN)を提案する。
提案手法は最先端技術を実現し,計算オーバーヘッドや視覚効果の観点から,他の自己教師付きアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-29T15:19:01Z) - Spatially Adaptive Self-Supervised Learning for Real-World Image
Denoising [73.71324390085714]
本稿では,現実の sRGB 画像復号化の問題を解決するために,新しい視点を提案する。
ノイズの多い画像における平坦領域とテクスチャ領域のそれぞれの特徴を考慮し、それらを個別に管理する。
LAN自体がBNNの出力で管理されているのに対して,我々はその要件を満たすためのローカル・アウェア・ネットワーク(LAN)を提案する。
論文 参考訳(メタデータ) (2023-03-27T06:18:20Z) - AP-BSN: Self-Supervised Denoising for Real-World Images via Asymmetric
PD and Blind-Spot Network [60.650035708621786]
ブラインド・スポット・ネットワーク(BSN)とその変種は、自己監督型デノナイジングにおいて大きな進歩を遂げた。
自己教師付きBSNを用いて空間的に相関した実世界の雑音に対処することは困難である。
近年,実世界の雑音の空間的相関を取り除くために,画素シャッフルダウンサンプリング (PD) が提案されている。
本稿では,この問題に対処する非対称PD(AP)を提案する。
論文 参考訳(メタデータ) (2022-03-22T15:04:37Z) - Hyperspectral Image Super-resolution via Deep Progressive Zero-centric
Residual Learning [62.52242684874278]
空間情報とスペクトル情報の相互モダリティ分布が問題となる。
本稿では,PZRes-Netという,新しいテクスライトウェイトなディープニューラルネットワークベースのフレームワークを提案する。
本フレームワークは,高分解能かつテクテッセロ中心の残像を学習し,シーンの空間的詳細を高頻度で表現する。
論文 参考訳(メタデータ) (2020-06-18T06:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。