論文の概要: Efficient Neural Network Encoding for 3D Color Lookup Tables
- arxiv url: http://arxiv.org/abs/2412.15438v1
- Date: Thu, 19 Dec 2024 22:41:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 16:24:41.541144
- Title: Efficient Neural Network Encoding for 3D Color Lookup Tables
- Title(参考訳): 3次元カラールックアップテーブルの効率的なニューラルネットワーク符号化
- Authors: Vahid Zehtab, David B. Lindell, Marcus A. Brubaker, Michael S. Brown,
- Abstract要約: 3Dカラールックアップテーブル(LUT)は、入力RGB値を特定の出力RGB値にマッピングすることで、正確な色操作を可能にする。
LUTは、ビデオ編集、カメラ内処理、写真フィルター、コンピュータグラフィックス、ディスプレイのカラー処理など、様々な用途で有効である。
この研究は、数百のLUTを単一のコンパクト表現でエンコードできるニューラルネットワークアーキテクチャを開発することを目的としている。
- 参考スコア(独自算出の注目度): 40.0698003668364
- License:
- Abstract: 3D color lookup tables (LUTs) enable precise color manipulation by mapping input RGB values to specific output RGB values. 3D LUTs are instrumental in various applications, including video editing, in-camera processing, photographic filters, computer graphics, and color processing for displays. While an individual LUT does not incur a high memory overhead, software and devices may need to store dozens to hundreds of LUTs that can take over 100 MB. This work aims to develop a neural network architecture that can encode hundreds of LUTs in a single compact representation. To this end, we propose a model with a memory footprint of less than 0.25 MB that can reconstruct 512 LUTs with only minor color distortion ($\bar{\Delta}E_M$ $\leq$ 2.0) over the entire color gamut. We also show that our network can weight colors to provide further quality gains on natural image colors ($\bar{\Delta}{E}_M$ $\leq$ 1.0). Finally, we show that minor modifications to the network architecture enable a bijective encoding that produces LUTs that are invertible, allowing for reverse color processing. Our code is available at https://github.com/vahidzee/ennelut.
- Abstract(参考訳): 3Dカラールックアップテーブル(LUT)は、入力RGB値を特定の出力RGB値にマッピングすることで、正確な色操作を可能にする。
3D LUTは、ビデオ編集、カメラ内処理、写真フィルター、コンピュータグラフィックス、ディスプレイのカラー処理など、様々な用途で有効である。
個々のLUTは高いメモリオーバーヘッドを発生しないが、ソフトウェアやデバイスは100MB以上を要する数十から数百のLUTを格納する必要があるかもしれない。
この研究は、数百のLUTを単一のコンパクト表現でエンコードできるニューラルネットワークアーキテクチャを開発することを目的としている。
この目的のために、メモリフットプリントが0.25MB未満のモデルを提案し、512 LUTを小さな色歪みだけで再構成できる($\bar{\Delta}E_M$$\leq$ 2.0)。
また、当社のネットワークは色を重み付けして、自然画像の色にさらなる品質向上をもたらすことができる($\bar{\Delta}{E}_M$$\leq$ 1.0)。
最後に、ネットワークアーキテクチャのマイナーな変更により、可逆なLUTを生成するビジェクティブエンコーディングが可能となり、逆色処理が可能となることを示す。
私たちのコードはhttps://github.com/vahidzee/ennelut.comで公開されています。
関連論文リスト
- Taming Lookup Tables for Efficient Image Retouching [30.48643578900116]
我々は、畳み込みニューラルネットワーク(CNN)を使わずに、極めて効率的なエッジ推論にLUTを採用するICELUTを提案する。
ICELUTは最先端の性能と極めて低消費電力を実現している。
これにより、最初のLUTベースのイメージエンハンサーであるICELUTは、GPUでは0.4ms、CPUでは7msという前例のない速度に達し、CNNソリューションよりも少なくとも1桁高速になる。
論文 参考訳(メタデータ) (2024-03-28T08:49:35Z) - Learning Naturally Aggregated Appearance for Efficient 3D Editing [94.47518916521065]
カラーフィールドを2次元の鮮明なアグリゲーションに置き換えることを提案する。
歪み効果を回避し、簡便な編集を容易にするため、3Dの点をテクスチャルックアップのために2Dピクセルにマッピングする投影場を標準画像に補完する。
私たちの表現はAGAPと呼ばれ、再最適化を必要とせず、様々な3D編集方法(スタイル化、インタラクティブな描画、コンテンツ抽出など)をうまくサポートしています。
論文 参考訳(メタデータ) (2023-12-11T18:59:31Z) - NILUT: Conditional Neural Implicit 3D Lookup Tables for Image
Enhancement [82.75363196702381]
3次元ルックアップテーブル(3D LUT)は、画像強調のための重要なコンポーネントである。
3D LUTを学習し、適用するための現在のアプローチは、明らかに高速だが、メモリ効率はそれほど高くない。
ニューラルネットワークによってパラメータ化される暗黙的に定義された連続3次元色変換であるニューラルインプリシット LUT (NILUT) を提案する。
論文 参考訳(メタデータ) (2023-06-20T22:06:39Z) - One-Shot Neural Fields for 3D Object Understanding [112.32255680399399]
ロボット工学のための統一的でコンパクトなシーン表現を提案する。
シーン内の各オブジェクトは、幾何学と外観をキャプチャする潜在コードによって描写される。
この表現は、新しいビューレンダリングや3D再構成、安定した把握予測といった様々なタスクのためにデコードできる。
論文 参考訳(メタデータ) (2022-10-21T17:33:14Z) - AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time
Image Enhancement [28.977992864519948]
AdaIntは3次元カラー空間における非一様サンプリング間隔を適応的に学習することで、より柔軟なサンプリングポイント割り当てを実現する新しいメカニズムである。
AdaIntは3D LUT方式のコンパクトで効率的なプラグアンドプレイモジュールとして実装できる。
論文 参考訳(メタデータ) (2022-04-29T10:16:57Z) - UV Volumes for Real-time Rendering of Editable Free-view Human
Performance [35.089358945669865]
UV Volumesは、人間のパフォーマーの編集可能なフリービュービデオをリアルタイムでレンダリングするアプローチである。
高周波(非滑らかな)人間のテクスチャを3次元ボリュームから取り除き、2次元のニューラルテクスチャスタックにエンコードすることで実現される。
CMU Panoptic、ZJU Mocap、H36Mデータセットの実験は、我々のモデルが40fpsで900×500画像をレンダリングできることを示しています。
論文 参考訳(メタデータ) (2022-03-27T21:54:36Z) - $\mu$NCA: Texture Generation with Ultra-Compact Neural Cellular Automata [79.00163348781422]
高コンパクトモデルを用いた実例に基づく手続き的テクスチャ合成の問題点について検討する。
我々は,NCA(Neural Cellular Automata)ルールによってパラメータ付けされた生成過程の学習に,微分可能プログラミングを用いる。
論文 参考訳(メタデータ) (2021-11-26T15:26:37Z) - Learning Image-adaptive 3D Lookup Tables for High Performance Photo
Enhancement in Real-time [33.93249921871407]
本稿では,画像適応型3次元ルックアップテーブル(3D LUT)を学習し,高速でロバストな画像強調を実現する。
アノテーション付きデータからペアワイドやアンペアラーニングを用いて3D LUTを学習する。
我々は、複数のベース3D LUTと小さな畳み込みニューラルネットワーク(CNN)をエンドツーエンドで同時に学習する。
論文 参考訳(メタデータ) (2020-09-30T06:34:57Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。