論文の概要: Adaptive Patch Exiting for Scalable Single Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2203.11589v1
- Date: Tue, 22 Mar 2022 10:13:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 22:53:56.918232
- Title: Adaptive Patch Exiting for Scalable Single Image Super-Resolution
- Title(参考訳): スケーラブルな単一画像超解像に対する適応的パッチ抽出
- Authors: Shizun Wang, Ming Lu, Kaixin Chen, Xiaoqi Li, Jiaming Liu, Yandong Guo
- Abstract要約: 本稿では、より実用的な高速化を実現するために、適応パッチ実行(APE)に基づくスケーラブルな手法を提案する。
提案手法の利点を実証するために,様々なバックボーン,データセット,スケーリング要因にわたる広範な実験を行った。
- 参考スコア(独自算出の注目度): 19.39197401813409
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since the future of computing is heterogeneous, scalability is a crucial
problem for single image super-resolution. Recent works try to train one
network, which can be deployed on platforms with different capacities. However,
they rely on the pixel-wise sparse convolution, which is not hardware-friendly
and achieves limited practical speedup. As image can be divided into patches,
which have various restoration difficulties, we present a scalable method based
on Adaptive Patch Exiting (APE) to achieve more practical speedup.
Specifically, we propose to train a regressor to predict the incremental
capacity of each layer for the patch. Once the incremental capacity is below
the threshold, the patch can exit at the specific layer. Our method can easily
adjust the trade-off between performance and efficiency by changing the
threshold of incremental capacity. Furthermore, we propose a novel strategy to
enable the network training of our method. We conduct extensive experiments
across various backbones, datasets and scaling factors to demonstrate the
advantages of our method. Code will be released.
- Abstract(参考訳): コンピューティングの未来は異質であるため、単一画像の超解像ではスケーラビリティが重要な問題である。
最近の作業では、1つのネットワークをトレーニングし、異なるキャパシティを持つプラットフォームにデプロイする。
しかし、ハードウェアに親しみやすく、実用的なスピードアップが制限されるピクセルワイズスパース畳み込みに依存している。
画像は様々な復元困難を伴うパッチに分割できるため、より実用的な高速化を実現するために、適応パッチ実行(APE)に基づくスケーラブルな手法を提案する。
具体的には、パッチの各レイヤの増分容量を予測するために、回帰器をトレーニングすることを提案する。
インクリメンタルなキャパシティがしきい値以下になったら、パッチは特定のレイヤから抜け出すことができる。
インクリメンタルキャパシティの閾値を変化させることで,性能と効率のトレードオフを容易に調整できる。
さらに,本手法のネットワークトレーニングを実現するための新しい戦略を提案する。
我々は,様々なバックボーン,データセット,スケーリング要因をまたいで広範な実験を行い,本手法の利点を実証する。
コードはリリースされる。
関連論文リスト
- PatchScaler: An Efficient Patch-Independent Diffusion Model for Image Super-Resolution [44.345740602726345]
PatchScalerは、単一画像超解像のための効率的なパッチ非依存拡散パイプラインである。
テクスチャは、共通参照テクスチャメモリから、ターゲットパッチのテクスチャ先行を適応的に検索する。
本コードでは,定量評価と定性評価の両方において優れた性能を示し,推論を著しく高速化する。
論文 参考訳(メタデータ) (2024-05-27T13:31:46Z) - AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution [53.23803932357899]
我々は、処理時間を数時間から秒に短縮する最初のオンザフライ適応量子化フレームワークを導入する。
我々は,従来の適応量子化法と競合する性能を実現し,処理時間をx2000で高速化する。
論文 参考訳(メタデータ) (2024-04-04T08:37:27Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - Life Regression based Patch Slimming for Vision Transformers [35.63691293935569]
この問題に対処するいくつかの手法が提案されている。
本稿では,各画像パッチの寿命を1回で決定するライフレグレッションモジュールを提案する。
提案手法は, 競合性能を維持しつつ, 推論速度を向上させるために, 複数層での計算やパラメータの追加を回避する。
論文 参考訳(メタデータ) (2023-04-11T01:35:31Z) - HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。
入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。
このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文 参考訳(メタデータ) (2022-03-19T05:09:34Z) - Patch-Based Stochastic Attention for Image Editing [4.8201607588546]
PatchMatchアルゴリズムをベースとした,近接する近傍近傍の同定に有効なアテンション層を提案する。
画像インペイント, ガイド画像のカラー化, シングルイメージ超解像など, 画像編集作業におけるPSALの有用性を示す。
論文 参考訳(メタデータ) (2022-02-07T13:42:00Z) - Learning strides in convolutional neural networks [34.20666933112202]
この研究は、学習可能なステップを持つ最初のダウンサンプリング層であるDiffStrideを紹介している。
音声と画像の分類実験は,ソリューションの汎用性と有効性を示す。
論文 参考訳(メタデータ) (2022-02-03T16:03:36Z) - Lossless Image Compression Using a Multi-Scale Progressive Statistical
Model [16.58692559039154]
画素単位の自己回帰統計モデルに基づく手法は優れた性能を示した。
本稿では,画素ワイズアプローチとマルチスケールアプローチを利用したマルチスケールプログレッシブ統計モデルを提案する。
論文 参考訳(メタデータ) (2021-08-24T07:33:13Z) - Patch Slimming for Efficient Vision Transformers [107.21146699082819]
与えられたネットワーク上で冗長な計算を行うことにより,視覚変換器の効率性について検討する。
我々は、トップダウンパラダイムで無駄なパッチを捨てる、新しいパッチスリム化アプローチを提案する。
ベンチマークによる実験結果から,提案手法は視覚変換器の計算コストを大幅に削減できることが示された。
論文 参考訳(メタデータ) (2021-06-05T09:46:00Z) - Powers of layers for image-to-image translation [60.5529622990682]
本稿では,未ペア画像から画像への変換タスクに対処するシンプルなアーキテクチャを提案する。
固定重み付きイメージオートエンコーダアーキテクチャから始める。
各タスクに対して、潜在空間で動作している残留ブロックを学習し、ターゲット領域に到達するまで繰り返し呼び出される。
論文 参考訳(メタデータ) (2020-08-13T09:02:17Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。