論文の概要: LoR-LUT: Learning Compact 3D Lookup Tables via Low-Rank Residuals
- arxiv url: http://arxiv.org/abs/2602.22607v1
- Date: Thu, 26 Feb 2026 04:28:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.524482
- Title: LoR-LUT: Learning Compact 3D Lookup Tables via Low-Rank Residuals
- Title(参考訳): LoR-LUT:低ランク残差によるコンパクトな3Dルックアップテーブルの学習
- Authors: Ziqi Zhao, Abhijit Mishra, Shounak Roychowdhury,
- Abstract要約: LoR-LUTは、コンパクトで解釈可能な3Dルックアップテーブル(LUT)生成のための統一された低ランク定式化である。
LoR-LUTはMIT-Adobe FiveKデータセットでトレーニングされている。
LoR-LUT Viewerと呼ばれる対話型可視化ツールは、入力画像をLUT調整された出力画像に変換する。
- 参考スコア(独自算出の注目度): 8.420640298306237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present LoR-LUT, a unified low-rank formulation for compact and interpretable 3D lookup table (LUT) generation. Unlike conventional 3D-LUT-based techniques that rely on fusion of basis LUTs, which are usually dense tensors, our unified approach extends the current framework by jointly using residual corrections, which are in fact low-rank tensors, together with a set of basis LUTs. The approach described here improves the existing perceptual quality of an image, which is primarily due to the technique's novel use of residual corrections. At the same time, we achieve the same level of trilinear interpolation complexity, using a significantly smaller number of network, residual corrections, and LUT parameters. The experimental results obtained from LoR-LUT, which is trained on the MIT-Adobe FiveK dataset, reproduce expert-level retouching characteristics with high perceptual fidelity and a sub-megabyte model size. Furthermore, we introduce an interactive visualization tool, termed LoR-LUT Viewer, which transforms an input image into the LUT-adjusted output image, via a number of slidebars that control different parameters. The tool provides an effective way to enhance interpretability and user confidence in the visual results. Overall, our proposed formulation offers a compact, interpretable, and efficient direction for future LUT-based image enhancement and style transfer.
- Abstract(参考訳): 本稿では,コンパクトかつ解釈可能な3Dルックアップテーブル(LUT)生成のための低ランク統一式であるLoR-LUTを提案する。
通常、高密度テンソルである基底UTTの融合に依存する従来の3D-LUT法とは異なり、我々の統一的アプローチは、実際に低ランクテンソルである残留補正と基底UTTのセットを併用することにより、現在の枠組みを拡張している。
ここで述べられているアプローチは、画像の既存の知覚的品質を改善する。
同時に, ネットワーク数, 残差補正, LUTパラメータを著しく減らし, 線形補間複雑性のレベルを同等に達成する。
MIT-Adobe FiveKデータセットでトレーニングされたLoR-LUTから得られた実験結果は、知覚の忠実度が高く、サブメガバイトのモデルサイズを持つ専門家レベルのリタッチ特性を再現する。
さらに,LoR-LUT Viewerと呼ばれる対話型可視化ツールを導入し,異なるパラメータを制御するスライドバーを用いて,入力画像をLUT調整された出力画像に変換する。
このツールは、視覚的な結果に対する解釈可能性とユーザの信頼を高める効果的な方法を提供する。
全体として,提案する定式化は,LUTによる画像強調とスタイル転送のためのコンパクトで解釈可能な,効率的な方向を提供する。
関連論文リスト
- Joint Semantic and Rendering Enhancements in 3D Gaussian Modeling with Anisotropic Local Encoding [86.55824709875598]
本稿では,セマンティックとレンダリングの両方を相乗化する3次元セマンティックガウスモデリングのための統合拡張フレームワークを提案する。
従来の点雲形状符号化とは異なり、細粒度3次元形状を捉えるために異方性3次元ガウシアン・チェビシェフ記述子を導入する。
我々は、学習した形状パターンを継続的に更新するために、クロスシーンの知識伝達モジュールを使用し、より高速な収束と堅牢な表現を可能にします。
論文 参考訳(メタデータ) (2026-01-05T18:33:50Z) - FlowLUT: Efficient Image Enhancement via Differentiable LUTs and Iterative Flow Matching [10.213645938731338]
FlowLUTは、LUTの効率性、複数プリエント、フローマッチングされた再構成画像のパラメータ非依存特性を統合する、新しいエンドツーエンドモデルである。
軽量な融合予測ネットワークは複数の3D LUT上で動作し、シーン適応色補正には$mathcalO(1)$の複雑さがある。
モデル全体は、知覚的および構造的忠実性を含む複合損失関数の下で共同最適化される。
論文 参考訳(メタデータ) (2025-09-28T03:22:01Z) - Lightweight and Fast Real-time Image Enhancement via Decomposition of the Spatial-aware Lookup Tables [22.15777751379876]
3次元ルックアップテーブル(3D LUT)に基づく画像強調手法は,モデルサイズと実行時間の両方を効率的に削減する。
しかし、3D LUT法は空間情報の欠如により限界がある。
本稿では,テーブルの冗長部分に着目して画像適応型LUTを生成する手法を提案する。
論文 参考訳(メタデータ) (2025-08-22T06:28:24Z) - G-CUT3R: Guided 3D Reconstruction with Camera and Depth Prior Integration [57.67450930037339]
G-CUT3Rは,ガイド付き3次元シーン再構成のための新しいフィードフォワード手法である。
入力画像のみに依存する既存のフィードフォワード法とは異なり,本手法では奥行き,カメラキャリブレーション,カメラ位置などの補助的データを活用する。
論文 参考訳(メタデータ) (2025-08-15T10:25:58Z) - CLUE: Leveraging Low-Rank Adaptation to Capture Latent Uncovered Evidence for Image Forgery Localization [35.73353140683283]
画像編集ツールや生成AIのアクセシビリティ向上は、視覚的に説得力のある偽造物の普及につながっている。
本稿では、その内部生成過程を利用して、最先端(SOTA)テキスト・画像合成モデルのメカニズムを再利用する。
本稿では,Low- Rank Adaptation (LoRA) を用いてパラメータ効率よく安定拡散3 (SD3) を法定特徴抽出器として構成するフレームワークであるCLUEを提案する。
論文 参考訳(メタデータ) (2025-08-10T16:22:30Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - AttentionLut: Attention Fusion-based Canonical Polyadic LUT for
Real-time Image Enhancement [38.61183657952919]
本稿では,リアルタイム画像強調のための新しいフレームワークであるAttentionLutを提案する。
提案するフレームワークは,3つの軽量モジュールから構成される。
MIT-Adobe FiveKデータセットのベンチマーク実験により、提案手法は最先端の手法よりも優れた向上性能が得られることが示された。
論文 参考訳(メタデータ) (2024-01-03T06:55:06Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。