論文の概要: Adaptive Local Implicit Image Function for Arbitrary-scale
Super-resolution
- arxiv url: http://arxiv.org/abs/2208.04318v1
- Date: Sun, 7 Aug 2022 11:23:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 12:06:02.234996
- Title: Adaptive Local Implicit Image Function for Arbitrary-scale
Super-resolution
- Title(参考訳): 任意スケール超解像に対する適応的局所インシシット画像関数
- Authors: Hongwei Li, Tao Dai, Yiming Li, Xueyi Zou, Shu-Tao Xia
- Abstract要約: 局所暗黙画像関数(LIIF)は、対応する座標を入力として、画素値が拡張される連続関数として画像を表す。
LIIFは任意のスケールの超解像タスクに適用でき、その結果、様々なアップスケーリング要因に対して単一の効率的かつ効率的なモデルが得られる。
この問題を軽減するために,新しい適応型局所像関数(A-LIIF)を提案する。
- 参考スコア(独自算出の注目度): 61.95533972380704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image representation is critical for many visual tasks. Instead of
representing images discretely with 2D arrays of pixels, a recent study, namely
local implicit image function (LIIF), denotes images as a continuous function
where pixel values are expansion by using the corresponding coordinates as
inputs. Due to its continuous nature, LIIF can be adopted for arbitrary-scale
image super-resolution tasks, resulting in a single effective and efficient
model for various up-scaling factors. However, LIIF often suffers from
structural distortions and ringing artifacts around edges, mostly because all
pixels share the same model, thus ignoring the local properties of the image.
In this paper, we propose a novel adaptive local image function (A-LIIF) to
alleviate this problem. Specifically, our A-LIIF consists of two main
components: an encoder and a expansion network. The former captures cross-scale
image features, while the latter models the continuous up-scaling function by a
weighted combination of multiple local implicit image functions. Accordingly,
our A-LIIF can reconstruct the high-frequency textures and structures more
accurately. Experiments on multiple benchmark datasets verify the effectiveness
of our method. Our codes are available at
\url{https://github.com/LeeHW-THU/A-LIIF}.
- Abstract(参考訳): 画像表現は多くのビジュアルタスクにとって重要です。
2次元の画素配列で画像を個別に表現する代わりに、最近の研究、すなわち局所暗黙画像関数(LIIF)は、対応する座標を用いて画素値が拡張される連続関数として画像を表す。
連続的な性質のため、LIIFは任意のスケールの超解像タスクに適用でき、その結果、様々なアップスケーリング要因に対して単一の効率的かつ効率的なモデルが得られる。
しかし、LIIFは、画像の局所的な特性を無視して、すべてのピクセルが同じモデルを共有するため、しばしばエッジを囲む構造上の歪みやアーティファクトに悩まされる。
本稿では,この問題を軽減するための適応型局所画像関数(a-liif)を提案する。
具体的には、A-LIIFはエンコーダと拡張ネットワークの2つの主要コンポーネントから構成される。
前者は大規模画像の特徴を捉え、後者は複数の局所的な暗黙的画像関数の重み付けによる連続的なアップスケーリング関数をモデル化する。
したがって、我々のA-LIIFはより正確に高周波テクスチャや構造を再構築することができる。
複数のベンチマークデータセットの実験により,本手法の有効性が検証された。
我々のコードは \url{https://github.com/LeeHW-THU/A-LIIF} で入手できる。
関連論文リスト
- Image-GS: Content-Adaptive Image Representation via 2D Gaussians [55.15950594752051]
本稿では,コンテンツ適応型画像表現であるImage-GSを提案する。
異方性2Dガウスアンをベースとして、Image-GSは高いメモリ効率を示し、高速なランダムアクセスをサポートし、自然なレベルのディテールスタックを提供する。
画像-GSの一般的な効率性と忠実性は、最近のニューラルイメージ表現と業界標準テクスチャ圧縮機に対して検証される。
この研究は、機械認識、アセットストリーミング、コンテンツ生成など、適応的な品質とリソース制御を必要とする新しいアプリケーションを開発するための洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。
本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。
本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-29T15:05:11Z) - Dynamic Implicit Image Function for Efficient Arbitrary-Scale Image
Representation [24.429100808481394]
任意の解像度の画像を高速かつ効率的に表現できる動的インプリシット画像関数(DIIF)を提案する。
本稿では,座標スライスから画素値スライスへのデコードを可能にする座標グルーピングとスライス戦略を提案する。
動的座標スライシングにより、DIIFは任意のスケールのSRに遭遇する際の計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2023-06-21T15:04:34Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - Single Image Super-Resolution via a Dual Interactive Implicit Neural
Network [5.331665215168209]
本稿では,任意のスケール因子における単一画像の超解像処理のための新しい暗黙的ニューラルネットワークを提案する。
公開されているベンチマークデータセット上で、最先端技術に対するアプローチの有効性と柔軟性を実証する。
論文 参考訳(メタデータ) (2022-10-23T02:05:19Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - Learning Continuous Image Representation with Local Implicit Image
Function [21.27344998709831]
画像座標と座標周辺の2次元深部特徴を入力として捉えたLIIF表現を、所定の座標におけるRGB値を出力として予測する。
画像の連続表現を生成するために、LIIF表現のエンコーダをスーパーレゾリューションの自己監視タスクを介してトレーニングします。
学習された連続表現は任意の解像度で x30 の高分解能まで外挿することができる。
論文 参考訳(メタデータ) (2020-12-16T18:56:50Z) - Adversarial Generation of Continuous Images [31.92891885615843]
本稿では,INRに基づく画像デコーダ構築のための2つの新しいアーキテクチャ手法を提案する。
私たちは、最先端の連続画像GANを構築するためにそれらを使用します。
提案したINR-GANアーキテクチャは連続画像生成装置の性能を数倍改善する。
論文 参考訳(メタデータ) (2020-11-24T11:06:40Z) - Funnel Activation for Visual Recognition [92.18474421444377]
ファンネルアクティベーション(FRELU)という,概念的にシンプルだが効果的なファンネルアクティベーションを画像認識タスクに提示する。
FRELUは空間条件の無視可能なオーバーヘッドを追加することにより、ReLUとPRELUを2Dアクティベーションに拡張する。
我々は、画像ネット、COCO検出、セマンティックセグメンテーションの実験を行い、視覚認識タスクにおけるFRELUの大幅な改善と堅牢性を示す。
論文 参考訳(メタデータ) (2020-07-23T07:02:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。