Fugu-MT 論文翻訳(概要): NILUT: Conditional Neural Implicit 3D Lookup Tables for Image Enhancement

論文の概要: NILUT: Conditional Neural Implicit 3D Lookup Tables for Image Enhancement

arxiv url: http://arxiv.org/abs/2306.11920v3
Date: Sun, 24 Dec 2023 13:12:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-27 22:33:27.852449
Title: NILUT: Conditional Neural Implicit 3D Lookup Tables for Image Enhancement
Title（参考訳）: NILUT:画像強調のための条件付きニューラルインシシデント3Dルックアップテーブル
Authors: Marcos V. Conde, Javier Vazquez-Corral, Michael S. Brown, Radu Timofte
Abstract要約: 3次元ルックアップテーブル(3D LUT)は、画像強調のための重要なコンポーネントである。 3D LUTを学習し、適用するための現在のアプローチは、明らかに高速だが、メモリ効率はそれほど高くない。ニューラルネットワークによってパラメータ化される暗黙的に定義された連続3次元色変換であるニューラルインプリシット LUT (NILUT) を提案する。
参考スコア（独自算出の注目度）: 82.75363196702381
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: 3D lookup tables (3D LUTs) are a key component for image enhancement. Modern image signal processors (ISPs) have dedicated support for these as part of the camera rendering pipeline. Cameras typically provide multiple options for picture styles, where each style is usually obtained by applying a unique handcrafted 3D LUT. Current approaches for learning and applying 3D LUTs are notably fast, yet not so memory-efficient, as storing multiple 3D LUTs is required. For this reason and other implementation limitations, their use on mobile devices is less popular. In this work, we propose a Neural Implicit LUT (NILUT), an implicitly defined continuous 3D color transformation parameterized by a neural network. We show that NILUTs are capable of accurately emulating real 3D LUTs. Moreover, a NILUT can be extended to incorporate multiple styles into a single network with the ability to blend styles implicitly. Our novel approach is memory-efficient, controllable and can complement previous methods, including learned ISPs. Code, models and dataset available at: https://github.com/mv-lab/nilut
Abstract（参考訳）: 3次元ルックアップテーブル(3D LUT)は画像強調のための重要なコンポーネントである。現代の画像信号プロセッサ(ISP)は、カメラレンダリングパイプラインの一部としてこれらをサポートする。カメラは通常、絵のスタイルに複数のオプションを提供し、それぞれのスタイルは通常、ユニークな手作りの3D LUTを適用することで得られる。 3D LUTを学習および適用するための現在のアプローチは、特に高速であるが、複数の3D LUTを格納する必要があるため、メモリ効率は高くない。この理由やその他の実装上の制限のため、モバイルデバイスでの使用はそれほど一般的ではない。本研究では,ニューラルネットワークによってパラメータ化される暗黙的に定義された連続3次元色変換であるニューラルインプリシット LUT (NILUT) を提案する。 NILUTは実3D LUTを正確にエミュレートできることを示す。さらに、NILUTは複数のスタイルを単一のネットワークに組み込むように拡張でき、暗黙的にスタイルをブレンドすることができる。我々の新しいアプローチはメモリ効率が高く、制御可能であり、学習ISPを含む従来の手法を補完することができる。コード、モデル、データセット:https://github.com/mv-lab/nilut

関連論文リスト

Cues3D: Unleashing the Power of Sole NeRF for Consistent and Unique Instances in Open-Vocabulary 3D Panoptic Segmentation [48.231573110948]
Open-vocabulary 3D panoptic segmentationは、最近重要なトレンドとして現れている。先行連想の代わりにNeural Radiance Field(NeRF)のみに依存するコンパクトなアプローチであるCues3Dを提案する。 ScanNet v2、ScanNet200、ScanNet++、Replicaの3Dインスタンス、パノプティクス、セマンティックセグメンテーションタスクを対象に実験を行った。
論文参考訳（メタデータ） (2025-05-01T08:12:03Z)
Flash3D: Feed-Forward Generalisable 3D Scene Reconstruction from a Single Image [80.48452783328995]
Flash3Dは、1つの画像からシーン再構成と新しいビュー合成を行う方法である。一般性については、単分子深度推定のための「基礎」モデルから始める。効率性のために、我々はこの拡張をフィードフォワードガウススプラッティングに基づける。
論文参考訳（メタデータ） (2024-06-06T17:59:56Z)
An intuitive multi-frequency feature representation for SO(3)-equivariant networks [9.092163300680832]
本稿では,高次元特徴空間に3次元点をマッピングするための同変特徴表現を提案する。我々の表現はVNへの入力として使用することができ、その結果、我々の特徴表現により、VNはより詳細をキャプチャすることを示した。
論文参考訳（メタデータ） (2024-03-15T11:36:50Z)
Free3D: Consistent Novel View Synthesis without 3D Representation [63.931920010054064]
Free3Dは単分子開集合新規ビュー合成(NVS)の簡易的高精度な方法である同様のアプローチを採った他の作品と比較して,明快な3D表現に頼らずに大幅な改善が得られた。
論文参考訳（メタデータ） (2023-12-07T18:59:18Z)
WildFusion: Learning 3D-Aware Latent Diffusion Models in View Space [77.92350895927922]
潜在拡散モデル(LDM)に基づく3次元画像合成の新しいアプローチであるWildFusionを提案する。我々の3D対応LCMは、マルチビュー画像や3D幾何学を直接監督することなく訓練されている。これにより、スケーラブルな3D認識画像合成と、Wild画像データから3Dコンテンツを作成するための有望な研究道が開かれる。
論文参考訳（メタデータ） (2023-11-22T18:25:51Z)
Neural Feature Fusion Fields: 3D Distillation of Self-Supervised 2D Image Representations [92.88108411154255]
本稿では,3次元シーンとして再構成可能な複数画像の解析に後者を適用する際に,高密度な2次元画像特徴抽出器を改善する手法を提案する。本手法は,手動ラベルを使わずに,シーン固有のニューラルネットワークの文脈における意味理解を可能にするだけでなく,自己監督型2Dベースラインよりも一貫して改善されていることを示す。
論文参考訳（メタデータ） (2022-09-07T23:24:09Z)
Multi-NeuS: 3D Head Portraits from Single Image with Neural Implicit Functions [70.04394678730968]
人間の頭部の3次元再構築を1つか2つの視点から提案する。基盤となる神経アーキテクチャは、オブジェクトを学習し、モデルを一般化することである。私たちのモデルは、100本のビデオやワンショットの3Dスキャンに、斬新な頭を収めることができます。
論文参考訳（メタデータ） (2022-09-07T21:09:24Z)
Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time [33.93249921871407]
本稿では,画像適応型3次元ルックアップテーブル(3D LUT)を学習し,高速でロバストな画像強調を実現する。アノテーション付きデータからペアワイドやアンペアラーニングを用いて3D LUTを学習する。我々は、複数のベース3D LUTと小さな畳み込みニューラルネットワーク(CNN)をエンドツーエンドで同時に学習する。
論文参考訳（メタデータ） (2020-09-30T06:34:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。