Fugu-MT 論文翻訳(概要): Benchmarking Ultra-High-Definition Image Reflection Removal

論文の概要: Benchmarking Ultra-High-Definition Image Reflection Removal

arxiv url: http://arxiv.org/abs/2308.00265v1
Date: Tue, 1 Aug 2023 03:56:50 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-02 15:31:35.544901
Title: Benchmarking Ultra-High-Definition Image Reflection Removal
Title（参考訳）: 超高精細画像反射除去ベンチマーク
Authors: Zhenyuan Zhang, Zhenbo Song, Kaihao Zhang, Wenhan Luo, Zhaoxin Fan, Jianfeng Lu
Abstract要約: 本稿では,リフレクション除去のためのRRFormerというトランスフォーマーアーキテクチャを提案する。 RRFormerは非UHDデータセットと提案したUHDRRデータセットの両方で最先端のパフォーマンスを実現する。
参考スコア（独自算出の注目度）: 43.34342640578687
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep learning based methods have achieved significant success in the task of single image reflection removal (SIRR). However, the majority of these methods are focused on High-Definition/Standard-Definition (HD/SD) images, while ignoring higher resolution images such as Ultra-High-Definition (UHD) images. With the increasing prevalence of UHD images captured by modern devices, in this paper, we aim to address the problem of UHD SIRR. Specifically, we first synthesize two large-scale UHD datasets, UHDRR4K and UHDRR8K. The UHDRR4K dataset consists of $2,999$ and $168$ quadruplets of images for training and testing respectively, and the UHDRR8K dataset contains $1,014$ and $105$ quadruplets. To the best of our knowledge, these two datasets are the first largest-scale UHD datasets for SIRR. Then, we conduct a comprehensive evaluation of six state-of-the-art SIRR methods using the proposed datasets. Based on the results, we provide detailed discussions regarding the strengths and limitations of these methods when applied to UHD images. Finally, we present a transformer-based architecture named RRFormer for reflection removal. RRFormer comprises three modules, namely the Prepossessing Embedding Module, Self-attention Feature Extraction Module, and Multi-scale Spatial Feature Extraction Module. These modules extract hypercolumn features, global and partial attention features, and multi-scale spatial features, respectively. To ensure effective training, we utilize three terms in our loss function: pixel loss, feature loss, and adversarial loss. We demonstrate through experimental results that RRFormer achieves state-of-the-art performance on both the non-UHD dataset and our proposed UHDRR datasets. The code and datasets are publicly available at https://github.com/Liar-zzy/Benchmarking-Ultra-High-Definition-Single-Image-Reflection-Removal.
Abstract（参考訳）: 深層学習に基づく手法は、単一画像反射除去(SIRR)の課題において大きな成功を収めた。しかし、これらの手法の大部分は高精細/標準精細(hd/sd)画像に焦点を合わせ、超精細(uhd)画像のような高精細画像は無視している。本稿では,現代のデバイスが捉えたUHD画像の普及に伴い,UHD SIRRの問題点に対処することを目的とする。具体的には,UHDRR4KとUHDRR8Kという2つの大規模UHDデータセットを合成する。 UHDRR4Kデータセットは、それぞれトレーニング用とテスト用のイメージの2999ドルと168ドルの四つ組で構成され、UHDRR8Kデータセットは1,014ドルと105ドルの四つ組を含んでいる。我々の知る限りでは、これらの2つのデータセットはSIRRのための最初の大規模UHDデータセットである。そして,提案したデータセットを用いて6つの最先端SIRR手法の総合評価を行う。この結果に基づき,これらの手法の長所と限界について,uhd画像に適用した場合の詳細な議論を行う。最後に,リフレクション除去のためのrrformerというトランスフォーマティブアーキテクチャを提案する。 RRFormerは、Prepossessing Embedding Module、セルフアテンション特徴抽出モジュール、マルチスケール空間特徴抽出モジュールの3つのモジュールから構成されている。これらのモジュールはそれぞれ、ハイパーカラム特徴、大域的および部分的注意特徴、およびマルチスケール空間特徴を抽出する。有効トレーニングを確保するために, 画素損失, 特徴損失, 対向損失の3つの項を利用する。我々は、RRFormerが非UHDデータセットと提案したUHDRRデータセットの両方で最先端の性能を達成する実験結果を通して示す。コードとデータセットはhttps://github.com/Liar-zzy/Benchmarking-Ultra-High-Definition-Single-Image-Reflection-Removalで公開されている。

関連論文リスト

SRSplat: Feed-Forward Super-Resolution Gaussian Splatting from Sparse Multi-View Images [22.87137082795346]
少数のLRビューから高解像度の3Dシーンを再構成するフィードフォワードフレームワークである textbfSRSplat を提案する。テクスチャ情報の欠如を補うために,外部の質の高い基準画像と内部テクスチャの手がかりを共同で活用する。
論文参考訳（メタデータ） (2025-11-15T05:17:44Z)
Learning Arbitrary-Scale RAW Image Downscaling with Wavelet-based Recurrent Reconstruction [31.56360631121638]
任意のスケールのRAW画像のダウンスケーリングを実現するために,ウェーブレットに基づくリカレント再構成フレームワークを提案する。本稿では,非整数ダウンスケーリング係数が1.3$times$であるRealistic Non-Integer RAW Downscaling(Real-NIRD)データセットを紹介する。提案手法は,既存のコンペティターの定量的および視覚的性能に優れる。
論文参考訳（メタデータ） (2025-07-31T03:17:10Z)
S2R-HDR: A Large-Scale Rendered Dataset for HDR Fusion [4.684215759472536]
S2R-は、HDR融合のための最初の大規模な高品質な合成データセットであり、24,000個のHDRサンプルがある。我々は、様々な動的要素、モーションタイプ、ハイダイナミックレンジシーン、照明を含む、多様な現実的なHDRシーンを設計する。合成データと実世界のデータのギャップを埋めるために設計されたドメイン適応であるS2R-Adapterを紹介する。
論文参考訳（メタデータ） (2025-04-10T11:39:56Z)
Large-Scale Data-Free Knowledge Distillation for ImageNet via Multi-Resolution Data Generation [53.95204595640208]
Data-Free Knowledge Distillation (DFKD)は、教師モデルから生徒モデルへの知識伝達を可能にする高度な技術である。従来のアプローチでは、実際の画像の情報を活用することなく、高解像度で合成画像を生成してきた。 MUSEは、クラスアクティベーションマップ(CAM)を使用して、低い解像度で画像を生成し、生成された画像が重要なクラス固有の特徴を保持することを保証する。
論文参考訳（メタデータ） (2024-11-26T02:23:31Z)
Dropout the High-rate Downsampling: A Novel Design Paradigm for UHD Image Restoration [11.866565346920781]
D2NetはUHD(Ultra-high-definition)画像の完全な推測を可能にする。本モデルは,最先端手法よりも定量的,定性的な結果が得られることを示す。
論文参考訳（メタデータ） (2024-11-10T13:05:36Z)
A Cycle Ride to HDR: Semantics Aware Self-Supervised Framework for Unpaired LDR-to-HDR Image Translation [0.0]
低ダイナミックレンジ(LDR)から高ダイナミックレンジ(High Dynamic Range)への画像変換は重要なコンピュータビジョン問題である。現在の最先端の手法のほとんどは、モデルトレーニングのための高品質なペアLDR、データセットを必要とする。本稿では,改良型サイクル整合対向アーキテクチャを提案し,未ペアのLDR,データセットをトレーニングに利用した。
論文参考訳（メタデータ） (2024-10-19T11:11:58Z)
Rethinking Image Super-Resolution from Training Data Perspectives [54.28824316574355]
画像超解像(SR)におけるトレーニングデータの効果について検討する。そこで我々は,自動画像評価パイプラインを提案する。その結果, (i) 圧縮アーチファクトの少ないデータセット, (ii) 被写体数によって判断される画像内多様性の高いデータセット, (iii) ImageNet や PASS からの大量の画像がSR性能に肯定的な影響を与えることがわかった。
論文参考訳（メタデータ） (2024-09-01T16:25:04Z)
Assessing UHD Image Quality from Aesthetics, Distortions, and Saliency [51.36674160287799]
我々は3つの視点からUHD画像の品質を評価するためにマルチブランチディープニューラルネットワーク(DNN)を設計する。 UHD画像から低解像度画像から美的特徴を抽出する。 UHD画像から抽出したミニパッチからなる断片画像を用いて, 技術的歪みを測定する。 UHD画像の塩分含有量を検知し、収穫し、塩分領域から品質認識特徴を抽出する。
論文参考訳（メタデータ） (2024-09-01T15:26:11Z)
Ultra-High-Definition Image Restoration: New Benchmarks and A Dual Interaction Prior-Driven Solution [37.42524995828323]
UHD-Snow と UHD-Rain という名の UHD 雪と降雨のベンチマークを構築した。各ベンチマークには3200の分解/クリアイメージ対の4K解像度が含まれている。モデル設計における勾配と正規項を考慮した効率的なUHD画像復元法を提案する。
論文参考訳（メタデータ） (2024-06-19T14:58:49Z)
Towards Ultra-High-Definition Image Deraining: A Benchmark and An Efficient Method [42.331058889312466]
本稿では,4K解像度で13,000枚の画像対を含む4K-Rain13kの大規模UHD画像デライニングデータセットについて述べる。我々は,この課題をより効果的かつ効率的な視覚ベースアーキテクチャ (UDR-Mixer) を開発した。
論文参考訳（メタデータ） (2024-05-27T11:45:08Z)
Embedding Fourier for Ultra-High-Definition Low-Light Image Enhancement [78.67036949708795]
UHD(Ultra-High-Definition)写真は、高度な撮像装置の標準構成となっている。本稿では,Fourier変換をカスケードネットワークに組み込む新しいソリューションUHDFourを提案する。また,2,150個の低雑音/正規クラー4K画像ペアを含むUHD LLIEデータセットである textbfUHD-LL をコントリビュートした。
論文参考訳（メタデータ） (2023-02-23T07:43:41Z)
WHU-Hi: UAV-borne hyperspectral with high spatial resolution (H2) benchmark datasets for hyperspectral image classification [5.281167336437183]
wuhan uav-borne hyperspectral image (whu-hi)データセットと呼ばれる新しいベンチマークデータセットがハイパースペクトル画像分類のために構築された。 WHU-Hiデータセットは高いスペクトル分解能(nmレベル)と非常に高い空間分解能(cmレベル)を持つ。 WHU-Hiデータセットをベンチマークし、実験結果から、WHU-Hiは挑戦的なデータセットであることが示された。
論文参考訳（メタデータ） (2020-12-27T11:28:37Z)
HDR-GAN: HDR Image Reconstruction from Multi-Exposed LDR Images with Large Motions [62.44802076971331]
マルチ露光LDR画像からHDR画像を合成するための新しいGANモデルHDR-GANを提案する。本手法は,敵対学習を取り入れることで,欠落したコンテンツのある領域に忠実な情報を生成することができる。
論文参考訳（メタデータ） (2020-07-03T11:42:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。