論文の概要: SUPER Decoder Block for Reconstruction-Aware U-Net Variants
- arxiv url: http://arxiv.org/abs/2511.11015v1
- Date: Fri, 14 Nov 2025 07:06:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.46911
- Title: SUPER Decoder Block for Reconstruction-Aware U-Net Variants
- Title(参考訳): 再構成型U-Net変数のためのスーパーデコーダブロック
- Authors: Siheon Joo, Hongjo Kim,
- Abstract要約: スキップ接続型エンコーダデコーダアーキテクチャ (U-Net variants) は、逆問題に対して広く採用されているが、情報損失に悩まされている。
本稿では、ウェーブレットの完全復元(PR)特性を利用して情報劣化を防止する選択的抑圧完全再構成(Super)を提案する。
Superは様々なU-Net変種のためのプラグイン・アンド・プレイ・デコーダブロックとして機能し、固有の再構築ボトルネックを排除し、表現豊かさを高める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Skip-connected encoder-decoder architectures (U-Net variants) are widely adopted for inverse problems but still suffer from information loss, limiting recovery of fine high-frequency details. We present Selectively Suppressed Perfect Reconstruction (SUPER), which exploits the perfect reconstruction (PR) property of wavelets to prevent information degradation while selectively suppressing (SS) redundant features. Free from rigid framelet constraints, SUPER serves as a plug-and-play decoder block for diverse U-Net variants, eliminating their intrinsic reconstruction bottlenecks and enhancing representational richness. Experiments across diverse crack benchmarks, including state-of-the-art (SOTA) models, demonstrate the structural potential of the proposed SUPER Decoder Block. Maintaining comparable computational cost, SUPER enriches representational diversity through increased parameterization. In small-scale in-domain experiments on the CrackVision12K dataset, SUPER markedly improves thin-crack segmentation performance, particularly for cracks narrower than 4 px, underscoring its advantage in high-frequency dominant settings. In smartphone image denoising on SIDD, where low-frequency components prevail, SUPER still achieves a moderate gain in PSNR, confirming its robustness across low- and high-frequency regimes. These results validate its plug-and-play generality across U-Net variants, achieving high-frequency fidelity and global coherence within a unified, reconstruction-aware framework.
- Abstract(参考訳): スキップ接続型エンコーダ・デコーダアーキテクチャ(U-Net variants)は、逆問題に対して広く採用されているが、情報損失に悩まされており、高周波の詳細の回復が制限されている。
本稿では、ウェーブレットの完全復元(PR)特性を利用して、SSの冗長な特徴を選択的に抑制しながら、情報劣化を防止する選択的抑圧完全再構成(SUPER)を提案する。
厳密なフレームレット制約を伴わず、 SUPER は様々な U-Net 変種に対するプラグ・アンド・プレイ・デコーダブロックとして機能し、固有の再構築ボトルネックを排除し、表現豊かさを高める。
State-of-the-art (SOTA)モデルを含む様々なクラックベンチマークの実験は、提案されたSUPERデコーダブロックの構造的ポテンシャルを実証している。
同等の計算コストを維持するために、SUPERはパラメータ化の増大を通じて表現の多様性を高める。
CrackVision12Kデータセットの小さなドメイン内実験では、SUPERは、特に4px未満のクラックに対して、シンクラックセグメンテーション性能を著しく改善し、高周波支配的な設定におけるその優位性を裏付けている。
低周波成分が普及しているSIDD上のスマートフォン画像では、SUPERは依然としてPSNRの適度な利得を達成し、低周波および高周波状態における堅牢性を確認している。
これらの結果は,U-Net 変種間のプラグ・アンド・プレイの汎用性を検証し,統一された再構築対応フレームワーク内での高周波忠実性とグローバルコヒーレンスを実現する。
関連論文リスト
- FCA2: Frame Compression-Aware Autoencoder for Modular and Fast Compressed Video Super-Resolution [68.77813885751308]
最先端(SOTA)圧縮ビデオ超解像(CVSR)モデルは、長期の推論時間、複雑なトレーニングパイプライン、補助情報への依存など、永続的な課題に直面している。
ハイパースペクトル画像(HSI)とビデオデータの構造的および統計的類似性から着想を得た,効率的でスケーラブルなソリューションを提案する。
提案手法では,計算複雑性を低減し,推論を高速化し,フレーム間の時間情報の抽出を促進する圧縮駆動型次元減少戦略を導入する。
論文 参考訳(メタデータ) (2025-06-13T07:59:52Z) - FANeRV: Frequency Separation and Augmentation based Neural Representation for Video [32.35716293561769]
ビデオのための周波数分離と拡張に基づくニューラル表現(FANeRV)を提案する。
FANeRVは離散ウェーブレット変換を用いて入力フレームを高周波数成分と低周波数成分に明示的に分離する。
特別に設計されたゲートネットワークは、これらの周波数成分を効果的に融合して最適な再構成を行う。
論文 参考訳(メタデータ) (2025-04-09T10:19:35Z) - Plug-and-Play Tri-Branch Invertible Block for Image Rescaling [11.457556028893329]
高分解能(HR)画像は通常、帯域幅を減らすために低分解能(LR)にダウンスケールされ、続いて元の細部をアップスケールして復元する。
画像再スケーリングアルゴリズムの最近の進歩は、ダウンスケーリングとアップスケーリングのための統一されたフレームワークを作成するために、非可逆ニューラルネットワーク(INN)を使用している。
本稿では、低周波分岐を輝度(Y)と輝度(CbCr)に分解するプラグアンドプレイ三分岐可逆ブロック(T-InvBlocks)を提案する。
論文 参考訳(メタデータ) (2024-12-18T05:14:13Z) - High-Frequency Enhanced Hybrid Neural Representation for Video Compression [32.38933743785333]
本稿では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。
本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。
BunnyおよびUVGデータセットの実験は、我々の手法が他の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-11-11T03:04:46Z) - Structured Sparsity Learning for Efficient Video Super-Resolution [99.1632164448236]
我々は、ビデオ超解像(VSR)モデルの特性に応じて、構造化スパシティ学習(SSL)と呼ばれる構造化プルーニング手法を開発する。
SSLでは,残差ブロック,リカレントネットワーク,アップサンプリングネットワークなど,VSRモデルのいくつかの重要なコンポーネントに対するプルーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-06-15T17:36:04Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Lightweight image super-resolution with enhanced CNN [82.36883027158308]
強い表現力を持つ深部畳み込みニューラルネットワーク(CNN)は、単一画像超解像(SISR)において印象的な性能を達成した
情報抽出・拡張ブロック(IEEB)、再構築ブロック(RB)、情報精製ブロック(IRB)の3つの連続したサブブロックを持つ軽量拡張SR CNN(LESRCNN)を提案する。
IEEBは階層的低分解能(LR)特徴を抽出し、SISRの深い層上の浅い層の記憶能力を高めるために、得られた特徴を段階的に集約する。
RBはグローバルに拡散することで低周波特徴を高周波特徴に変換する
論文 参考訳(メタデータ) (2020-07-08T18:03:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。