論文の概要: Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping
- arxiv url: http://arxiv.org/abs/2310.17190v2
- Date: Wed, 3 Jan 2024 11:44:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-04 16:34:24.225313
- Title: Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping
- Title(参考訳): 局所ラプラシアンフィルタのルックアップテーブル:トーンマッピングのためのピラミッド再構成ネットワーク
- Authors: Feng Zhang, Ming Tian, Zhiqiang Li, Bin Xu, Qingbo Lu, Changxin Gao,
and Nong Sang
- Abstract要約: 本稿では, 閉形式ラプラシアンピラミッドの分解と復元を利用して, グローバルおよびローカル演算子を統合する新しい戦略について検討する。
周波数情報の特徴を利用して低周波画像のトーンを操作するために,画像適応型3D LUTを用いた。
また、局所ラプラシアフィルタを用いて、高周波成分のエッジ詳細を適応的に洗練する。
- 参考スコア(独自算出の注目度): 35.47139372780014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tone mapping aims to convert high dynamic range (HDR) images to low dynamic
range (LDR) representations, a critical task in the camera imaging pipeline. In
recent years, 3-Dimensional LookUp Table (3D LUT) based methods have gained
attention due to their ability to strike a favorable balance between
enhancement performance and computational efficiency. However, these methods
often fail to deliver satisfactory results in local areas since the look-up
table is a global operator for tone mapping, which works based on pixel values
and fails to incorporate crucial local information. To this end, this paper
aims to address this issue by exploring a novel strategy that integrates global
and local operators by utilizing closed-form Laplacian pyramid decomposition
and reconstruction. Specifically, we employ image-adaptive 3D LUTs to
manipulate the tone in the low-frequency image by leveraging the specific
characteristics of the frequency information. Furthermore, we utilize local
Laplacian filters to refine the edge details in the high-frequency components
in an adaptive manner. Local Laplacian filters are widely used to preserve edge
details in photographs, but their conventional usage involves manual tuning and
fixed implementation within camera imaging pipelines or photo editing tools. We
propose to learn parameter value maps progressively for local Laplacian filters
from annotated data using a lightweight network. Our model achieves
simultaneous global tone manipulation and local edge detail preservation in an
end-to-end manner. Extensive experimental results on two benchmark datasets
demonstrate that the proposed method performs favorably against
state-of-the-art methods.
- Abstract(参考訳): トーンマッピングの目的は、高ダイナミックレンジ(HDR)画像を低ダイナミックレンジ(LDR)表現に変換することである。
近年,3次元ルックアップテーブル(3d lut)に基づく手法が注目されている。
しかし,これらの手法は,図表が画素値に基づいて動作し,重要なローカル情報を組み込むことができないグローバルなトーンマッピング演算子であるため,局所的に良好な結果をもたらすことができないことが多い。
そこで本稿では,閉じたラプラシアンピラミッドの分解と再構成を活かし,グローバル・ローカル・オペレーターを統合した新しい戦略を提案する。
具体的には,画像適応型3dlutを用いて,周波数情報の特定の特性を利用して低周波画像のトーンを操作する。
さらに,局所ラプラシアンフィルタを用いて高周波成分のエッジ詳細を適応的に洗練する。
局所ラプラシアンフィルタは写真のエッジディテールを保存するために広く使われているが、従来の用途は手動のチューニングとカメライメージングパイプラインや写真編集ツールでの固定化である。
本稿では,局所ラプラシアンフィルタのパラメータ値マップを,軽量ネットワークを用いた注釈データから段階的に学習する。
本モデルでは,グローバルトーン操作と局所エッジ詳細保存をエンドツーエンドで同時に行う。
2つのベンチマークデータセットの広範な実験結果から,提案手法が最先端手法に対して好適に機能することが示された。
関連論文リスト
- GLFNET: Global-Local (frequency) Filter Networks for efficient medical
image segmentation [18.314093733807972]
医用画像分割のためのGlobal-Local Filter Network (GLFNet) と呼ばれるトランスフォーマースタイルのアーキテクチャを提案する。
モデル効率を最適化するために,自己認識機構をグローバルローカルフィルタブロックの組み合わせに置き換える。
GLFNetを3つのベンチマークデータセットでテストし、GFLOP操作の約2倍の効率を保ちながら、最先端のパフォーマンスを実現した。
論文 参考訳(メタデータ) (2024-03-01T09:35:03Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [54.56928482110888]
本稿では,まず3次元ガウス表現を同時局所化・マッピングシステムで利用するtextbfGS-SLAM$を紹介する。
提案手法では,地図の最適化とRGB-D再レンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - LATITUDE: Robotic Global Localization with Truncated Dynamic Low-pass
Filter in City-scale NeRF [5.364698641882657]
都市規模ニューラルレージアンスフィールド(NeRF)における2段階位置決め機構について述べる。
位置認識の段階では、トレーニングされたNeRFから生成された画像を通して回帰器を訓練し、グローバルなローカライゼーションの初期値を提供する。
ポーズ最適化の段階では、タンジェント平面上でのポーズを直接最適化することにより、観測画像とレンダリング画像との間の残差を最小化する。
提案手法を合成・実世界の双方で評価し,大規模都市景観における高精度ナビゲーションの可能性を示す。
論文 参考訳(メタデータ) (2022-09-18T07:56:06Z) - LODE: Deep Local Deblurring and A New Benchmark [106.80269193462712]
我々はBLur-Aware Deblurring Network(BladeNet)と呼ばれる新しいフレームワークを提案する。
ローカルブラー合成モジュールは局所的にぼやけたトレーニングペアを生成し、ローカルブラー知覚モジュールは局所的にぼやけた領域を自動的に捕捉し、Blar-guided Space Attentionモジュールは遅延ネットワークを空間的注意でガイドする。
我々は,REDS と LODE データセットの広範な実験を行い,BladeNet がPSNR を 2.5dB で改善し,SotAs を局所的に改善し,グローバルデブロアに匹敵する性能を維持していることを示す。
論文 参考訳(メタデータ) (2021-09-19T15:57:28Z) - MFGNet: Dynamic Modality-Aware Filter Generation for RGB-T Tracking [72.65494220685525]
可視データと熱データ間のメッセージ通信を促進するために,新しい動的モダリティ対応フィルタ生成モジュール(MFGNet)を提案する。
我々は、2つの独立ネットワークを持つ動的モダリティ対応フィルタを生成し、その可視フィルタとサーマルフィルタをそれぞれ、対応する入力特徴写像上で動的畳み込み演算を行う。
重閉塞,高速移動,外見による問題に対処するため,新たな方向認識型目標誘導型アテンション機構を活用することで,共同で局所的・グローバル検索を行うことを提案する。
論文 参考訳(メタデータ) (2021-07-22T03:10:51Z) - Deep Reformulated Laplacian Tone Mapping [6.078183247169192]
広ダイナミックレンジ(WDR)画像は、一般的な画像と比較して、シーンの詳細とコントラストがより多く含まれている。
WDR画像の詳細は、トーンマッピングプロセス中に減少する可能性がある。
本研究では,新しいラプラシアンピラミッドと深層学習を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2021-01-31T01:18:20Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - SPAN: Spatial Pyramid Attention Network forImage Manipulation
Localization [24.78951727072683]
本稿では,複数種類の画像操作の検出と位置決定のための新しいフレームワークである空間ピラミッド注意ネットワーク(SPAN)を提案する。
SPANは汎用的な合成データセットでトレーニングされるが、特定のデータセットに対して微調整することもできる。
提案手法は,従来の最先端手法に比べて,標準データセットの性能が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-09-01T21:59:35Z) - Polarimetric SAR Image Semantic Segmentation with 3D Discrete Wavelet
Transform and Markov Random Field [32.59900433812833]
本稿では,文脈的PolSAR画像セマンティックセグメンテーション手法を提案する。
3D-DWT手法は,新たに定義したチャネル的に一貫した特徴を入力として,スペックルノイズに頑健な識別的マルチスケール特徴を抽出する。
3D-DWT機能とMRFプリエントを同時に活用することにより、セグメンテーション中にコンテキスト情報が完全に統合され、正確かつスムーズなセグメンテーションが保証される。
論文 参考訳(メタデータ) (2020-08-05T08:28:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。