論文の概要: Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping
- arxiv url: http://arxiv.org/abs/2310.17190v1
- Date: Thu, 26 Oct 2023 07:05:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 21:42:57.850949
- Title: Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping
- Title(参考訳): 局所ラプラシアンフィルタのルックアップテーブル:トーンマッピングのためのピラミッド再構成ネットワーク
- Authors: Feng Zhang, Ming Tian, Zhiqiang Li, Bin Xu, Qingbo Lu, Changxin Gao,
Nong Sang
- Abstract要約: 本稿では, 閉形式ラプラシアンピラミッドの分解と復元を利用して, グローバルおよびローカル演算子を統合する新しい戦略について検討する。
周波数情報の特徴を利用して低周波画像のトーンを操作するために,画像適応型3D LUTを用いた。
また、局所ラプラシアフィルタを用いて、高周波成分のエッジ詳細を適応的に洗練する。
- 参考スコア(独自算出の注目度): 37.2501323285818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tone mapping aims to convert high dynamic range (HDR) images to low dynamic
range (LDR) representations, a critical task in the camera imaging pipeline. In
recent years, 3-Dimensional LookUp Table (3D LUT) based methods have gained
attention due to their ability to strike a favorable balance between
enhancement performance and computational efficiency. However, these methods
often fail to deliver satisfactory results in local areas since the look-up
table is a global operator for tone mapping, which works based on pixel values
and fails to incorporate crucial local information. To this end, this paper
aims to address this issue by exploring a novel strategy that integrates global
and local operators by utilizing closed-form Laplacian pyramid decomposition
and reconstruction. Specifically, we employ image-adaptive 3D LUTs to
manipulate the tone in the low-frequency image by leveraging the specific
characteristics of the frequency information. Furthermore, we utilize local
Laplacian filters to refine the edge details in the high-frequency components
in an adaptive manner. Local Laplacian filters are widely used to preserve edge
details in photographs, but their conventional usage involves manual tuning and
fixed implementation within camera imaging pipelines or photo editing tools. We
propose to learn parameter value maps progressively for local Laplacian filters
from annotated data using a lightweight network. Our model achieves
simultaneous global tone manipulation and local edge detail preservation in an
end-to-end manner. Extensive experimental results on two benchmark datasets
demonstrate that the proposed method performs favorably against
state-of-the-art methods.
- Abstract(参考訳): トーンマッピングの目的は、高ダイナミックレンジ(HDR)画像を低ダイナミックレンジ(LDR)表現に変換することである。
近年,3次元ルックアップテーブル(3d lut)に基づく手法が注目されている。
しかし,これらの手法は,図表が画素値に基づいて動作し,重要なローカル情報を組み込むことができないグローバルなトーンマッピング演算子であるため,局所的に良好な結果をもたらすことができないことが多い。
そこで本稿では,閉じたラプラシアンピラミッドの分解と再構成を活かし,グローバル・ローカル・オペレーターを統合した新しい戦略を提案する。
具体的には,画像適応型3dlutを用いて,周波数情報の特定の特性を利用して低周波画像のトーンを操作する。
さらに,局所ラプラシアンフィルタを用いて高周波成分のエッジ詳細を適応的に洗練する。
局所ラプラシアンフィルタは写真のエッジディテールを保存するために広く使われているが、従来の用途は手動のチューニングとカメライメージングパイプラインや写真編集ツールでの固定化である。
本稿では,局所ラプラシアンフィルタのパラメータ値マップを,軽量ネットワークを用いた注釈データから段階的に学習する。
本モデルでは,グローバルトーン操作と局所エッジ詳細保存をエンドツーエンドで同時に行う。
2つのベンチマークデータセットの広範な実験結果から,提案手法が最先端手法に対して好適に機能することが示された。
関連論文リスト
- FaVoR: Features via Voxel Rendering for Camera Relocalization [23.7893950095252]
カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文 参考訳(メタデータ) (2024-09-11T18:58:16Z) - Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations [8.522160106746478]
様々な3次元地図表現にまたがる単一カメラ画像のローカライズが可能なグローバルな視覚的ローカライゼーションシステムを提案する。
本システムは,シーンの新たなビューを合成し,RGBと深度画像のペアを作成することでデータベースを生成する。
NeRF合成画像は、クエリ画像を平均72%の成功率でローカライズし、優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-21T19:37:17Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - GLFNET: Global-Local (frequency) Filter Networks for efficient medical
image segmentation [18.314093733807972]
医用画像分割のためのGlobal-Local Filter Network (GLFNet) と呼ばれるトランスフォーマースタイルのアーキテクチャを提案する。
モデル効率を最適化するために,自己認識機構をグローバルローカルフィルタブロックの組み合わせに置き換える。
GLFNetを3つのベンチマークデータセットでテストし、GFLOP操作の約2倍の効率を保ちながら、最先端のパフォーマンスを実現した。
論文 参考訳(メタデータ) (2024-03-01T09:35:03Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - LATITUDE: Robotic Global Localization with Truncated Dynamic Low-pass
Filter in City-scale NeRF [5.364698641882657]
都市規模ニューラルレージアンスフィールド(NeRF)における2段階位置決め機構について述べる。
位置認識の段階では、トレーニングされたNeRFから生成された画像を通して回帰器を訓練し、グローバルなローカライゼーションの初期値を提供する。
ポーズ最適化の段階では、タンジェント平面上でのポーズを直接最適化することにより、観測画像とレンダリング画像との間の残差を最小化する。
提案手法を合成・実世界の双方で評価し,大規模都市景観における高精度ナビゲーションの可能性を示す。
論文 参考訳(メタデータ) (2022-09-18T07:56:06Z) - LODE: Deep Local Deblurring and A New Benchmark [106.80269193462712]
我々はBLur-Aware Deblurring Network(BladeNet)と呼ばれる新しいフレームワークを提案する。
ローカルブラー合成モジュールは局所的にぼやけたトレーニングペアを生成し、ローカルブラー知覚モジュールは局所的にぼやけた領域を自動的に捕捉し、Blar-guided Space Attentionモジュールは遅延ネットワークを空間的注意でガイドする。
我々は,REDS と LODE データセットの広範な実験を行い,BladeNet がPSNR を 2.5dB で改善し,SotAs を局所的に改善し,グローバルデブロアに匹敵する性能を維持していることを示す。
論文 参考訳(メタデータ) (2021-09-19T15:57:28Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - SPAN: Spatial Pyramid Attention Network forImage Manipulation
Localization [24.78951727072683]
本稿では,複数種類の画像操作の検出と位置決定のための新しいフレームワークである空間ピラミッド注意ネットワーク(SPAN)を提案する。
SPANは汎用的な合成データセットでトレーニングされるが、特定のデータセットに対して微調整することもできる。
提案手法は,従来の最先端手法に比べて,標準データセットの性能が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-09-01T21:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。