論文の概要: Towards Ultra-Resolution Neural Style Transfer via Thumbnail Instance
Normalization
- arxiv url: http://arxiv.org/abs/2103.11784v1
- Date: Mon, 22 Mar 2021 12:54:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:18:22.706285
- Title: Towards Ultra-Resolution Neural Style Transfer via Thumbnail Instance
Normalization
- Title(参考訳): サムネイルインスタンス正規化による超解像ニューラルスタイル伝達に向けて
- Authors: Zhe Chen, Wenhai Wang, Enze Xie, Tong Lu, Ping Luo
- Abstract要約: 任意の高解像度画像を柔軟に処理するために、非常にシンプルなウルトラリゾリューションスタイル転送フレームワーク「URST」を紹介します。
既存の最先端手法のほとんどは、超高解像度画像を処理する際のメモリコストとストロークサイズが小さいため、不足する。
- 参考スコア(独自算出の注目度): 42.84367334160332
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an extremely simple Ultra-Resolution Style Transfer framework,
termed URST, to flexibly process arbitrary high-resolution images (e.g.,
10000x10000 pixels) style transfer for the first time. Most of the existing
state-of-the-art methods would fall short due to massive memory cost and small
stroke size when processing ultra-high resolution images. URST completely
avoids the memory problem caused by ultra-high resolution images by 1) dividing
the image into small patches and 2) performing patch-wise style transfer with a
novel Thumbnail Instance Normalization (TIN). Specifically, TIN can extract
thumbnail's normalization statistics and apply them to small patches, ensuring
the style consistency among different patches. Overall, the URST framework has
three merits compared to prior arts. 1) We divide input image into small
patches and adopt TIN, successfully transferring image style with arbitrary
high-resolution. 2) Experiments show that our URST surpasses existing SOTA
methods on ultra-high resolution images benefiting from the effectiveness of
the proposed stroke perceptual loss in enlarging the stroke size. 3) Our URST
can be easily plugged into most existing style transfer methods and directly
improve their performance even without training. Code is available at
https://github.com/czczup/URST.
- Abstract(参考訳): 本稿では,任意の高解像度画像(例えば 10000x10000 ピクセル)を初めて柔軟に処理するための超簡易な超解像方式転送フレームワーク urst を提案する。
既存の最先端手法のほとんどは、超高解像度画像を処理する際のメモリコストとストロークサイズが小さいため、不足する。
URST は,1) 画像を小さなパッチに分割し,2) 新規なThumbnail Instance Normalization (TIN) を用いてパッチワイド転送を行うことにより,超高解像度画像によるメモリ問題を完全に回避する。
具体的には、TINはサムネイルの正規化統計を抽出し、それを小さなパッチに適用し、異なるパッチ間のスタイル整合性を保証する。
全体的なURSTフレームワークは、先行技術と比較して3つのメリットがある。
1) 入力画像を小さなパッチに分割し、TINを採用し、任意の高解像度で画像スタイルの転送に成功した。
2) 提案した脳卒中知覚損失が脳卒中サイズの増大に有効であることから, URSTは既存のSOTA法を超高分解能画像上で超越していることが示された。
3) URSTは既存のほとんどのスタイル転送手法に簡単に接続でき, トレーニングなしで直接性能を向上させることができる。
コードはhttps://github.com/czczup/URST.comで入手できる。
関連論文リスト
- MoreStyle: Relax Low-frequency Constraint of Fourier-based Image Reconstruction in Generalizable Medical Image Segmentation [53.24011398381715]
MoreStyleと呼ばれるデータ拡張のためのPlug-and-Playモジュールを紹介します。
MoreStyleは、フーリエ空間の低周波制約を緩和することで、イメージスタイルを多様化する。
敵対的学習の助けを借りて、MoreStyleは潜在機能の中で最も複雑なスタイルの組み合わせを指差している。
論文 参考訳(メタデータ) (2024-03-18T11:38:47Z) - Scaling Painting Style Transfer [10.059627473725508]
ニューラル・スタイル・トランスファー(Neural Style Transfer, NST)は、スタイル・イメージからコンテンツ・イメージへ、前例のないほどリッチなスタイル・トランスファーを生成する技術である。
本稿では,超高解像度(UHR)画像に対するグローバル最適化の解法を提案する。
このような高精細な絵画スタイルに対して,本手法が不整合品質のスタイル転送を実現することを示す。
論文 参考訳(メタデータ) (2022-12-27T12:03:38Z) - Iterative Patch Selection for High-Resolution Image Recognition [10.847032625429717]
本稿では,メモリ使用量を入力サイズから分離する単純な手法であるIPSを提案する。
IPSは、最も健全なパッチだけを選択してこれを達成し、画像認識のためのグローバルな表現に集約する。
本手法は,最小のアクセラレータメモリを使用しながら,異なる領域,トレーニング体制,画像サイズにまたがって高い性能を示し,幅広い適用性を有する。
論文 参考訳(メタデータ) (2022-10-24T07:55:57Z) - HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。
入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。
このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文 参考訳(メタデータ) (2022-03-19T05:09:34Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Beyond Fine-tuning: Classifying High Resolution Mammograms using
Function-Preserving Transformations [32.40975574666405]
マンモグラムを分類する作業は、通常、病変が高解像度画像で小さいため、非常に困難です。
本稿では,MorphHRという新しいフレームワークを導入して,微調整以上のものを提案する。
提案するフレームワークは, 連続した非線形活性化ニューロンに対して, 機能保存変換を統合し, 内部的にネットワークを正規化し, マンモグラム分類を改善する。
論文 参考訳(メタデータ) (2021-01-20T03:04:07Z) - Block Shuffle: A Method for High-resolution Fast Style Transfer with
Limited Memory [4.511923587827301]
Fast Style Transferは、フィードフォワードニューラルネットワークを使って入力画像をレンダリングする一連のNeural Style Transferアルゴリズムである。
出力層の高次元のため、これらのネットワークは計算に多くのメモリを必要とする。
本稿では,メモリ消費の少ない1つのタスクを複数のサブタスクに変換し,メモリ消費の少ない複数のサブタスクに変換する,Emphblock shuffleという新しい画像合成手法を提案する。
論文 参考訳(メタデータ) (2020-08-09T10:33:21Z) - SRFlow: Learning the Super-Resolution Space with Normalizing Flow [176.07982398988747]
超解像度は、与えられた低解像度画像の複数の予測を可能にするため、不適切な問題である。
出力の条件分布を学習できる正規化フローベース超解法SRFlowを提案する。
我々のモデルは、単一損失、すなわち負のログ類似度を用いて、原則的に訓練されている。
論文 参考訳(メタデータ) (2020-06-25T06:34:04Z) - Collaborative Distillation for Ultra-Resolution Universal Style Transfer [71.18194557949634]
本稿では,エンコーダ-デコーダを用いたニューラルスタイル変換のための新しい知識蒸留法(コラボレーティブ蒸留)を提案する。
12GBのGPUで、初めて超高解像度(40メガピクセル以上)のユニバーサルなスタイル転送を実現しました。
論文 参考訳(メタデータ) (2020-03-18T18:59:31Z) - Remove Appearance Shift for Ultrasound Image Segmentation via Fast and
Universal Style Transfer [13.355791568003559]
本稿では、出現シフトを除去し、ディープニューラルネットワーク(DNN)の一般化能力を向上する新しい直感的なフレームワークを提案する。
われわれは、米国画像でこれまで検討されなかった外観シフトを取り除くために、普遍的なスタイル移行の精神に従う。
当フレームワークは,臨床用USスキャンに必要なリアルタイムな速度を実現した。
論文 参考訳(メタデータ) (2020-02-14T02:00:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。