論文の概要: RPBA-Net: An Interpretable Residual Pyramid Bilateral Affine Network for RAW-Domain ISP Enhancement
- arxiv url: http://arxiv.org/abs/2605.03626v1
- Date: Tue, 05 May 2026 10:55:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.906607
- Title: RPBA-Net: An Interpretable Residual Pyramid Bilateral Affine Network for RAW-Domain ISP Enhancement
- Title(参考訳): RPBA-Net:RAW-Domain ISP拡張のための解釈可能な残留ピラミッドバイラテラルアフィンネットワーク
- Authors: Yucheng Xin, Wu Chen, Xiang Chen, Guangwei Gao, Xinchun Wang, Ruize Wu, Dianjie Lu, Guijuan Zhang, Linwei Fan, Zhuoran Zheng,
- Abstract要約: RPBA-NetはRAWドメインISP拡張のための解釈可能な残留ピラミッド両側アフィンネットワークである。
ベースRGB表現を推定し、ID誘導残アフィン補正を学習することにより、残アフィンベース再構築を行う。
さらに、ピラミッドの両側アフィン格子を構築し、ガイド駆動の自己回帰適応スライシングとアダプティブクロス層融合を組み合わせる。
- 参考スコア(独自算出の注目度): 24.32028637382679
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To address module fragmentation, uninterpretable mappings, and deployment constraints in RAW-domain demosaicing, color correction, and detail enhancement, this paper proposes RPBA-Net, an interpretable residual pyramid bilateral affine network for RAW-domain ISP enhancement. Given packed RAW as input, the method performs residual affine base reconstruction by estimating a base RGB representation and learning identity-guided residual affine corrections, thereby unifying demosaicing and enhancement. It further builds pyramid bilateral affine grids and combines guide-driven autoregressive adaptive slicing with adaptive cross-layer fusion to hierarchically model global tone restoration and local texture enhancement. In addition, smoothness, cross-scale consistency, and magnitude regularization terms are introduced to improve model stability, controllability, and structural interpretability. Extensive experiments demonstrate that RPBA-Net surpasses representative RAW-to-sRGB methods and achieves state-of-the-art performance in reconstruction fidelity and perceptual quality, while maintaining low model complexity and strong deployment potential for mobile and embedded platforms.
- Abstract(参考訳): 本稿では,RAWドメインの復調,色補正,詳細化におけるモジュールのフラグメンテーション,非解釈的マッピング,配置制約に対処するため,RAWドメインISP拡張のための解釈可能な残差ピラミッドアフィンネットワークであるRPBA-Netを提案する。
入力として充填されたRAWが与えられた場合、ベースRGB表現を推定し、アイデンティティ誘導された残アフィン補正を学習することにより、復調と強化を統一して残アフィンベース再構築を行う。
さらに、ピラミッドの両側アフィン格子を構築し、ガイド駆動の自己回帰適応スライシングとアダプティブクロス層融合を組み合わせて、グローバルトーン復元と局所テクスチャ強化を階層的にモデル化する。
さらに、モデルの安定性、制御可能性、構造的解釈可能性を改善するために、滑らかさ、クロススケール一貫性、等級正規化項を導入している。
大規模な実験により,RPBA-NetはRAW-to-sRGBの代表的な手法を超越し,再現性と知覚品質の最先端性能を実現し,低モデル複雑性とモバイルおよび組込みプラットフォームへの展開可能性を維持した。
関連論文リスト
- Efficient Image Super-Resolution with Multi-Scale Spatial Adaptive Attention Networks [3.4782736103257323]
本稿では,マルチスケール空間適応注意ネットワーク(MSAAN)と呼ばれる,軽量画像超解像(SR)ネットワークを提案する。
提案手法のコアとなるのは,局所的な細部と長期のコンテキスト依存性を協調的にモデル化する,マルチスケール空間適応型注意モジュール(MSAA)である。
論文 参考訳(メタデータ) (2026-02-22T07:47:39Z) - Bidirectional Reward-Guided Diffusion for Real-World Image Super-Resolution [79.35296000454694]
拡散に基づく超解像は、豊富な詳細を合成することができるが、合成ペアデータで訓練されたモデルは、現実世界のLR画像では失敗することが多い。
我々は,超解像を軌道レベルの優先最適化として定式化する報奨誘導拡散フレームワークであるBird-SRを提案する。
実世界のSRベンチマークの実験では、Bird-SRは知覚品質において最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-05T19:21:45Z) - UniMRSeg: Unified Modality-Relax Segmentation via Hierarchical Self-Supervised Compensation [104.59740403500132]
マルチモーダルイメージセグメンテーションは、不完全/破損したモダリティの劣化による実際のデプロイメント課題に直面している。
階層型自己教師型補償(HSSC)による統一Modality-relaxセグメンテーションネットワーク(UniMRSeg)を提案する。
我々のアプローチは、入力レベル、特徴レベル、出力レベルをまたいだ完全なモダリティと不完全なモダリティの間の表現ギャップを階層的に橋渡しします。
論文 参考訳(メタデータ) (2025-09-19T17:29:25Z) - Unfolding Framework with Complex-Valued Deformable Attention for High-Quality Computer-Generated Hologram Generation [15.017958264826511]
コンピュータ生成ホログラフィー(CGH)はディープラーニングに基づくアルゴリズムで広く注目を集めている。
本稿では,勾配降下を2つのモジュールに分解するDeep Unfolding Network (DUN)を提案する。
論文 参考訳(メタデータ) (2025-08-29T14:21:22Z) - RemixFusion: Residual-based Mixed Representation for Large-scale Online RGB-D Reconstruction [22.84127950120426]
RemixFusionはシーン再構成とカメラポーズ推定のための新しい残差ベース混合表現である。
特に,明示的な粗いTSDFグリッドと暗黙的なニューラルモジュールからなる残差ベースのマップ表現を提案する。
我々の手法は、明示的あるいは暗黙的な表現に基づくものを含む、最先端のすべてのものを上回る。
論文 参考訳(メタデータ) (2025-07-23T15:27:09Z) - RealRep: Generalized SDR-to-HDR Conversion via Attribute-Disentangled Representation Learning [51.19027658873778]
WCG(High-Dynamic-Range Wide-Color-Gamut)技術が普及し,標準ダイナミックレンジ(SDR)コンテンツをHDRに変換する必要性が高まっている。
既存の方法は固定トーンマッピング演算子に依存しており、現実世界のSDRコンテンツに存在する様々な外観や劣化を扱うのに苦労している。
本稿では,構成不整合表現の学習により頑健性を高める一般化されたSDR-to- attributeフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-12T08:08:58Z) - RUN: Reversible Unfolding Network for Concealed Object Segmentation [61.13528324971598]
マスクドメインとRGBドメインの両方にわたる可逆戦略。
マスクとRGBドメインをまたいだ可逆的戦略を適用したReversible Unfolding Network (RUN)を提案する。
論文 参考訳(メタデータ) (2025-01-30T22:19:15Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。