論文の概要: An End-to-End Real-World Camera Imaging Pipeline
- arxiv url: http://arxiv.org/abs/2411.10773v1
- Date: Sat, 16 Nov 2024 11:19:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:27:32.246783
- Title: An End-to-End Real-World Camera Imaging Pipeline
- Title(参考訳): エンド・ツー・エンドのリアル・ワールド・カメラ・イメージング・パイプライン
- Authors: Kepeng Xu, Zijia Ma, Li Xu, Gang He, Yunsong Li, Wenxin Yu, Taichu Han, Cheng Yang,
- Abstract要約: 本稿では,リアルタイムカメラ撮像性能を向上させるために,エンドツーエンドカメラ撮像パイプライン(RealCamNet)を提案する。
RealCamNetはRAWからRGBへの高品質な変換とコンパクトな画像圧縮のために設計されている。
実験の結果,RealCamNetは推論遅延を低く抑え,最高の速度歪み性能が得られることがわかった。
- 参考スコア(独自算出の注目度): 26.595914212462183
- License:
- Abstract: Recent advances in neural camera imaging pipelines have demonstrated notable progress. Nevertheless, the real-world imaging pipeline still faces challenges including the lack of joint optimization in system components, computational redundancies, and optical distortions such as lens shading.In light of this, we propose an end-to-end camera imaging pipeline (RealCamNet) to enhance real-world camera imaging performance. Our methodology diverges from conventional, fragmented multi-stage image signal processing towards end-to-end architecture. This architecture facilitates joint optimization across the full pipeline and the restoration of coordinate-biased distortions. RealCamNet is designed for high-quality conversion from RAW to RGB and compact image compression. Specifically, we deeply analyze coordinate-dependent optical distortions, e.g., vignetting and dark shading, and design a novel Coordinate-Aware Distortion Restoration (CADR) module to restore coordinate-biased distortions. Furthermore, we propose a Coordinate-Independent Mapping Compression (CIMC) module to implement tone mapping and redundant information compression. Existing datasets suffer from misalignment and overly idealized conditions, making them inadequate for training real-world imaging pipelines. Therefore, we collected a real-world imaging dataset. Experiment results show that RealCamNet achieves the best rate-distortion performance with lower inference latency.
- Abstract(参考訳): ニューラルカメラ画像パイプラインの最近の進歩は顕著な進歩を示している。
それにもかかわらず、実際の撮像パイプラインは、システムコンポーネントのジョイント最適化の欠如、計算冗長性、レンズシェーディングなどの光学歪みなどの課題に直面しており、これを踏まえ、実世界の撮像性能を向上させるために、エンドツーエンドの撮像パイプライン(RealCamNet)を提案する。
本手法は,従来の断片化多段階画像信号処理からエンドツーエンドアーキテクチャへ展開する。
このアーキテクチャは、全パイプライン間の共同最適化と座標バイアス歪みの復元を容易にする。
RealCamNetはRAWからRGBへの高品質な変換とコンパクトな画像圧縮のために設計されている。
具体的には、座標依存の光歪み、例えば、ナビネット、ダークシェーディングを深く分析し、座標バイアスの歪みを復元する新しい座標認識歪み回復モジュール(CADR)を設計する。
さらに、トーンマッピングと冗長な情報圧縮を実装するためのコーディネート独立マッピング圧縮(CIMC)モジュールを提案する。
既存のデータセットは、ミスアライメントや過度に理想化された条件に悩まされており、実際の画像パイプラインのトレーニングには不十分である。
そこで我々は,実世界の画像データセットを収集した。
実験の結果,RealCamNetは推論遅延を低く抑え,最高の速度歪み性能が得られることがわかった。
関連論文リスト
- Decoupling Fine Detail and Global Geometry for Compressed Depth Map Super-Resolution [55.9977636042469]
ビット深度圧縮は、微妙な変化のある領域で均一な深度表現を生成し、詳細情報の回復を妨げる。
密集したランダムノイズは、シーンのグローバルな幾何学的構造を推定する精度を低下させる。
圧縮深度マップ超解像のための新しいフレームワークGDNetを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:37:30Z) - CT-NeRF: Incremental Optimizing Neural Radiance Field and Poses with Complex Trajectory [12.460959809597213]
ポーズや深度入力を伴わないRGB画像のみを用いた逐次再構成最適化パイプラインであるCT-NeRFを提案する。
実世界の2つのデータセットであるNeRFBusterとFree-DatasetにおけるCT-NeRFの性能を評価する。
論文 参考訳(メタデータ) (2024-04-22T06:07:06Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - An Asynchronous Linear Filter Architecture for Hybrid Event-Frame Cameras [9.69495347826584]
本稿では,HDRビデオ再構成と空間畳み込みのための非同期線形フィルタアーキテクチャを提案する。
提案したAKFパイプラインは、絶対強度誤差(69.4%削減)と画像類似度指数(平均35.5%改善)の両方において、他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-03T12:37:59Z) - Single Image LDR to HDR Conversion using Conditional Diffusion [18.466814193413487]
デジタル画像は現実的なシーンを再現することを目的としているが、Low Dynamic Range(LDR)カメラは現実のシーンの広いダイナミックレンジを表現できない。
本稿では,影やハイライトから複雑な詳細を復元するための深層学習に基づくアプローチを提案する。
提案フレームワークにディープベースオートエンコーダを組み込んで,コンディショニングに使用するLDR画像の潜在表現の質を高める。
論文 参考訳(メタデータ) (2023-07-06T07:19:47Z) - Learning Adaptive Warping for Real-World Rolling Shutter Correction [52.45689075940234]
本稿では,実世界のローリングシャッター(RS)補正データセットであるBS-RSCと,歪みビデオ中のRSフレームを補正するための対応するモデルを提案する。
ビデオキャプチャ用のCMOSベースのセンサを備えたコンシューマ市場のモバイルデバイスは、ビデオ取得プロセス中に相対的な動きが発生した場合、ローリングシャッター効果をもたらすことが多い。
論文 参考訳(メタデータ) (2022-04-29T05:13:50Z) - RBSRICNN: Raw Burst Super-Resolution through Iterative Convolutional
Neural Network [23.451063587138393]
RBSRICNN(Row Burst Super-Resolution Iterative Convolutional Neural Network)を提案する。
提案したネットワークは、中間SR推定を反復的に洗練することにより最終的な出力を生成する。
定量的および定性的な実験において提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-10-25T19:01:28Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z) - EventSR: From Asynchronous Events to Image Reconstruction, Restoration,
and Super-Resolution via End-to-End Adversarial Learning [75.17497166510083]
イベントカメラは強度の変化を感知し、従来のカメラよりも多くの利点がある。
イベントストリームからの強度画像の再構成手法が提案されている。
出力は依然として低解像度(LR)、ノイズ、非現実的である。
本研究では、イベントストリームからLR画像を再構成し、画像品質を高め、EventSRと呼ばれる拡張イメージをアップサンプリングする、新しいエンドツーエンドパイプラインを提案する。
論文 参考訳(メタデータ) (2020-03-17T10:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。