論文の概要: AutoLUT: LUT-Based Image Super-Resolution with Automatic Sampling and Adaptive Residual Learning
- arxiv url: http://arxiv.org/abs/2503.01565v2
- Date: Fri, 07 Mar 2025 16:08:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 12:25:41.083061
- Title: AutoLUT: LUT-Based Image Super-Resolution with Automatic Sampling and Adaptive Residual Learning
- Title(参考訳): AutoLUT: 自動サンプリングと適応残差学習によるLUT画像の超解像
- Authors: Yuheng Xu, Shijie Yang, Xin Liu, Jie Liu, Jie Tang, Gangshan Wu,
- Abstract要約: 我々は,Look-Up Table (LUT) ベースの超解像ネットワークにおいて,ピクセル情報を効果的にキャプチャし,活用するための2つのプラグイン・アンド・プレイ・モジュールを導入する。
本手法は,類似のストレージサイズを維持しつつ, MuLUT と SPF-LUT の双方で大幅な性能向上を実現している。
- 参考スコア(独自算出の注目度): 39.17438080141985
- License:
- Abstract: In recent years, the increasing popularity of Hi-DPI screens has driven a rising demand for high-resolution images. However, the limited computational power of edge devices poses a challenge in deploying complex super-resolution neural networks, highlighting the need for efficient methods. While prior works have made significant progress, they have not fully exploited pixel-level information. Moreover, their reliance on fixed sampling patterns limits both accuracy and the ability to capture fine details in low-resolution images. To address these challenges, we introduce two plug-and-play modules designed to capture and leverage pixel information effectively in Look-Up Table (LUT) based super-resolution networks. Our method introduces Automatic Sampling (AutoSample), a flexible LUT sampling approach where sampling weights are automatically learned during training to adapt to pixel variations and expand the receptive field without added inference cost. We also incorporate Adaptive Residual Learning (AdaRL) to enhance inter-layer connections, enabling detailed information flow and improving the network's ability to reconstruct fine details. Our method achieves significant performance improvements on both MuLUT and SPF-LUT while maintaining similar storage sizes. Specifically, for MuLUT, we achieve a PSNR improvement of approximately +0.20 dB improvement on average across five datasets. For SPF-LUT, with more than a 50% reduction in storage space and about a 2/3 reduction in inference time, our method still maintains performance comparable to the original. The code is available at https://github.com/SuperKenVery/AutoLUT.
- Abstract(参考訳): 近年、Hi-DPIスクリーンの人気が高まっ、高解像度画像の需要が高まっている。
しかしながら、エッジデバイスの限られた計算能力は、複雑な超解像ニューラルネットワークをデプロイする上での課題となり、効率的な方法の必要性を強調している。
以前の研究は大きな進歩を遂げたものの、ピクセルレベルの情報を十分に活用していない。
さらに、それらの固定サンプリングパターンへの依存は、低解像度画像の精度と細部を捉える能力の両方を制限している。
このような課題に対処するために,Look-Up Table (LUT) ベースの超解像ネットワークにおいて,画素情報を効果的にキャプチャし,活用するための2つのプラグイン・アンド・プレイモジュールを導入する。
提案手法では,自動サンプリング(AutoSample)というフレキシブルなLUTサンプリング手法を導入し,トレーニング中にサンプリング重量を自動学習して画素変動に適応させ,推論コストを伴わずに受容野を拡大する。
また、AdaRL(Adaptive Residual Learning)を導入し、層間接続を強化し、詳細な情報の流れを可能とし、詳細な詳細を再構築するネットワークの能力を向上させる。
本手法は,類似のストレージサイズを維持しつつ, MuLUT と SPF-LUT の双方で大幅な性能向上を実現している。
具体的には、MuLUTでは、5つのデータセットの平均で約0.20dBのPSNR改善を実現している。
SPF-LUTの場合、ストレージ容量が50%以上減少し、推論時間が約2/3削減されているため、本手法は元の値に匹敵する性能を維持している。
コードはhttps://github.com/SuperKenVery/AutoLUT.comで公開されている。
関連論文リスト
- FLARES: Fast and Accurate LiDAR Multi-Range Semantic Segmentation [52.89847760590189]
3Dシーンの理解は、自動運転における重要な課題である。
近年の手法では、レンジビュー表現を利用して処理効率を向上している。
範囲ビューに基づくLiDARセマンティックセマンティックセグメンテーションのためのワークフローを再設計する。
論文 参考訳(メタデータ) (2025-02-13T12:39:26Z) - EPS: Efficient Patch Sampling for Video Overfitting in Deep Super-Resolution Model Training [15.684865589513597]
ビデオSRネットワークオーバーフィッティングのための効率的なパッチサンプリング手法であるEPSを提案する。
本手法は,クラスタの解像度や数に応じて,トレーニング用パッチの数を4%から25%に削減する。
最新のパッチサンプリング手法であるEMTと比較して,本手法は全体の実行時間を83%削減する。
論文 参考訳(メタデータ) (2024-11-25T12:01:57Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - Low-Resolution Self-Attention for Semantic Segmentation [93.30597515880079]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - Pixel Adapter: A Graph-Based Post-Processing Approach for Scene Text
Image Super-Resolution [22.60056946339325]
アップサンプリングによる画素歪みに対処するために,グラフアテンションに基づくPixel Adapter Module (PAM)を提案する。
PAMは、各ピクセルが隣人と対話し、機能を更新することで、ローカルな構造情報を効果的にキャプチャする。
提案手法は,従来の認識精度を上回り,高品質な超解像を生成することを実証する。
論文 参考訳(メタデータ) (2023-09-16T08:12:12Z) - Super-Resolution of License Plate Images Using Attention Modules and
Sub-Pixel Convolution Layers [3.8831062015253055]
監視画像における構造的特徴およびテクスチャ的特徴の検出を強化するために,Single-Image Super-Resolution (SISR) アプローチを導入する。
提案手法は,サブピクセルの畳み込み層と,光学的文字認識(OCR)モデルを用いて特徴抽出を行うロス関数を含む。
以上の結果から, これらの低解像度合成画像の再構成手法は, 定量化と定性化の両面で, 既存の画像よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-05-27T00:17:19Z) - Toward DNN of LUTs: Learning Efficient Image Restoration with Multiple
Look-Up Tables [47.15181829317732]
エッジデバイス上の高解像度スクリーンは、効率的な画像復元アルゴリズムに対する強い需要を刺激する。
単一のルックアップテーブルのサイズはインデックス化能力の増加とともに指数関数的に増加する。
本稿では,Mulutと呼ばれるニューラルネットワークのような複数のLUTを構築するための普遍的手法を提案する。
論文 参考訳(メタデータ) (2023-03-25T16:00:33Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Hybrid Pixel-Unshuffled Network for Lightweight Image Super-Resolution [64.54162195322246]
畳み込みニューラルネットワーク(CNN)は画像超解像(SR)において大きな成功を収めた
ほとんどのディープCNNベースのSRモデルは、高い性能を得るために大量の計算を処理している。
SRタスクに効率的かつ効果的なダウンサンプリングモジュールを導入することで,HPUN(Hybrid Pixel-Unshuffled Network)を提案する。
論文 参考訳(メタデータ) (2022-03-16T20:10:41Z) - Pixel-Level Self-Paced Learning for Super-Resolution [101.13851473792334]
本稿では、SISRモデルの収束速度を高速化するために、PPL(Pixel-level Self-Paced Learning)と呼ばれるトレーニング戦略を設計する。
自己ペースト学習を模倣したPSPLは、予測SR画像中の各ピクセルとその対応するピクセルに注意重みを与え、パラメータ空間内のより良い領域にモデルを誘導する。
実験の結果、PSPLはSISRモデルの訓練を高速化し、いくつかの既存のモデルに新たなより良い結果を得るよう促すことができた。
論文 参考訳(メタデータ) (2020-03-06T10:04:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。