論文の概要: RAW-Flow: Advancing RGB-to-RAW Image Reconstruction with Deterministic Latent Flow Matching
- arxiv url: http://arxiv.org/abs/2601.20364v1
- Date: Wed, 28 Jan 2026 08:27:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.841395
- Title: RAW-Flow: Advancing RGB-to-RAW Image Reconstruction with Deterministic Latent Flow Matching
- Title(参考訳): RAW-Flow:決定論的ラテントフローマッチングによるRGB-to-RAW画像再構成の改善
- Authors: Zhen Liu, Diedong Feng, Hai Jiang, Liaoyuan Zeng, Hao Wang, Chaoyu Feng, Lei Lei, Bing Zeng, Shuaicheng Liu,
- Abstract要約: 本稿では,RGBとRAW表現のギャップを埋めるためにRAW-Flowという新しいフレームワークを提案する。
また、階層的なRGB機能をフロー推定プロセスに注入する、大規模コンテキストガイダンスモジュールも導入する。
RAW-Flowは、定量的にも視覚的にも最先端のアプローチより優れている。
- 参考スコア(独自算出の注目度): 55.03149221192589
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGB-to-RAW reconstruction, or the reverse modeling of a camera Image Signal Processing (ISP) pipeline, aims to recover high-fidelity RAW data from RGB images. Despite notable progress, existing learning-based methods typically treat this task as a direct regression objective and struggle with detail inconsistency and color deviation, due to the ill-posed nature of inverse ISP and the inherent information loss in quantized RGB images. To address these limitations, we pioneer a generative perspective by reformulating RGB-to-RAW reconstruction as a deterministic latent transport problem and introduce a novel framework named RAW-Flow, which leverages flow matching to learn a deterministic vector field in latent space, to effectively bridge the gap between RGB and RAW representations and enable accurate reconstruction of structural details and color information. To further enhance latent transport, we introduce a cross-scale context guidance module that injects hierarchical RGB features into the flow estimation process. Moreover, we design a dual-domain latent autoencoder with a feature alignment constraint to support the proposed latent transport framework, which jointly encodes RGB and RAW inputs while promoting stable training and high-fidelity reconstruction. Extensive experiments demonstrate that RAW-Flow outperforms state-of-the-art approaches both quantitatively and visually.
- Abstract(参考訳): RGB-to-RAW再構成(英: RGB-to-RAW reconstruction)は、RGB画像から高忠実なRAWデータを復元することを目的とした、カメラ画像信号処理(ISP)パイプラインの逆モデリングである。
顕著な進歩にもかかわらず、既存の学習ベースの手法では、逆ISPの性質の悪さと量子化RGB画像の固有情報損失のため、このタスクを直接回帰目標として扱うのが一般的である。
これらの制約に対処するために,RGB-to-RAW再構成を決定論的遅延輸送問題として再構成し,フローマッチングを利用して潜在空間における決定論的ベクトル場を学習し,RGBとRAW表現のギャップを効果的に橋渡しし,構造的詳細と色情報の正確な再構成を可能にするRAW-Flowという新しいフレームワークを導入することにより,生成的視点を開拓した。
遅延輸送をさらに強化するために,階層的なRGB機能をフロー推定プロセスに注入する,大規模コンテキスト誘導モジュールを導入する。
さらに,RGB と RAW の入力を共同で符号化し,安定したトレーニングと高忠実度再構成を推進し,機能アライメント制約を備えたデュアルドメイン潜時オートエンコーダを設計する。
RAW-Flowは、定量的にも視覚的にも、最先端のアプローチよりも優れることを示した。
関連論文リスト
- Histogram Assisted Quality Aware Generative Model for Resolution Invariant NIR Image Colorization [0.9064664319018063]
本稿では,分解能不変なNIR-to-RGBカラー化のための統一生成モデルHAQAGenを提案する。
提案モデルでは, (i) 異なるヒストグラムマッチング, 知覚的画像品質測定, テクスチャ情報を保存するための特徴に基づく類似性を通じて, グローバルな色統計を整合させる複合的損失項を導入する。
品質を犠牲にすることなく高分解能翻訳を可能にする適応分解能推論エンジンを導入する。
論文 参考訳(メタデータ) (2026-01-03T07:46:59Z) - RealRep: Generalized SDR-to-HDR Conversion via Attribute-Disentangled Representation Learning [51.19027658873778]
WCG(High-Dynamic-Range Wide-Color-Gamut)技術が普及し,標準ダイナミックレンジ(SDR)コンテンツをHDRに変換する必要性が高まっている。
既存の方法は固定トーンマッピング演算子に依存しており、現実世界のSDRコンテンツに存在する様々な外観や劣化を扱うのに苦労している。
本稿では,構成不整合表現の学習により頑健性を高める一般化されたSDR-to- attributeフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-12T08:08:58Z) - RAW-Diffusion: RGB-Guided Diffusion Models for High-Fidelity RAW Image Generation [4.625376287612609]
RGB画像でガイドされたRAW画像を生成するための新しい拡散法を提案する。
このアプローチは高忠実度RAW画像を生成し、カメラ固有のRAWデータセットの作成を可能にする。
提案手法を拡張してBDD100K-RAWとCityscapes-RAWデータセットを作成し,RAW画像におけるオブジェクト検出の有効性を明らかにする。
論文 参考訳(メタデータ) (2024-11-20T09:40:12Z) - A Learnable Color Correction Matrix for RAW Reconstruction [19.394856071610604]
複雑な逆画像信号処理装置(ISP)を近似する学習可能な色補正行列(CCM)を導入する。
実験結果から,本手法で生成したRAW(simRAW)画像は,より複雑な逆ISP法で生成した画像と同等の性能向上が得られた。
論文 参考訳(メタデータ) (2024-09-04T07:46:42Z) - Towards RGB-NIR Cross-modality Image Registration and Beyond [21.475871648254564]
本稿では,RGB(可視)-NIR(近赤外)クロスモダリティ画像登録の領域に着目した。
まずRGB-NIR画像登録(RGB-NIR-IRegis)ベンチマークを示す。
次に、可視画像と赤外線画像の非一貫性な局所的特徴がモデル性能に与える影響を明らかにするために、いくつかの指標を設計する。
論文 参考訳(メタデータ) (2024-05-30T10:25:50Z) - Collaborative Control for Geometry-Conditioned PBR Image Generation [4.41000596260979]
我々は、RGB生成における測光不正確さを回避し、直接PBR画像分布をモデル化することを提案する。
我々は、新しいネットワーク間通信パラダイムを用いて、凍結したRGBモデルに強く結びついている新しいPBRモデルを訓練する。
論文 参考訳(メタデータ) (2024-02-08T18:53:21Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Symmetric Uncertainty-Aware Feature Transmission for Depth
Super-Resolution [52.582632746409665]
カラー誘導DSRのためのSymmetric Uncertainty-aware Feature Transmission (SUFT)を提案する。
本手法は最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T06:35:59Z) - CIR-Net: Cross-modality Interaction and Refinement for RGB-D Salient
Object Detection [144.66411561224507]
本稿では,CIR-Netと呼ばれる畳み込みニューラルネットワーク(CNN)モデルを提案する。
我々のネットワークは、定性的かつ定量的に最先端の塩分濃度検出器より優れています。
論文 参考訳(メタデータ) (2022-10-06T11:59:19Z) - Learning RAW-to-sRGB Mappings with Inaccurately Aligned Supervision [76.41657124981549]
本稿では,画像アライメントとRAW-to-sRGBマッピングのための共同学習モデルを提案する。
実験の結果,本手法はZRRおよびSR-RAWデータセットの最先端に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-08-18T12:41:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。