論文の概要: SinIR: Efficient General Image Manipulation with Single Image
Reconstruction
- arxiv url: http://arxiv.org/abs/2106.07140v1
- Date: Mon, 14 Jun 2021 02:41:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 15:59:02.326742
- Title: SinIR: Efficient General Image Manipulation with Single Image
Reconstruction
- Title(参考訳): SinIR: 単一画像再構成による画像操作の効率化
- Authors: Jihyeong Yoo and Qifeng Chen
- Abstract要約: SinIRは、画像操作のための単一の自然なイメージに基づいて訓練された効率的な再構成ベースのフレームワークである。
我々は、各スケールのネットワークが画像再構成に責任を負うような、ケースド・マルチスケール・ラーニングを用いて、1つのイメージでモデルを訓練する。
SinIRはSinGAN(500 X 500イメージの場合)よりも33.5倍高速にトレーニングされており、同様のタスクを解決している。
- 参考スコア(独自算出の注目度): 45.60981228410952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose SinIR, an efficient reconstruction-based framework trained on a
single natural image for general image manipulation, including
super-resolution, editing, harmonization, paint-to-image, photo-realistic style
transfer, and artistic style transfer. We train our model on a single image
with cascaded multi-scale learning, where each network at each scale is
responsible for image reconstruction. This reconstruction objective greatly
reduces the complexity and running time of training, compared to the GAN
objective. However, the reconstruction objective also exacerbates the output
quality. Therefore, to solve this problem, we further utilize simple random
pixel shuffling, which also gives control over manipulation, inspired by the
Denoising Autoencoder. With quantitative evaluation, we show that SinIR has
competitive performance on various image manipulation tasks. Moreover, with a
much simpler training objective (i.e., reconstruction), SinIR is trained 33.5
times faster than SinGAN (for 500 X 500 images) that solves similar tasks. Our
code is publicly available at github.com/YooJiHyeong/SinIR.
- Abstract(参考訳): 超解像,編集,調和,ペイント・ツー・イメージ,フォトリアリスティック・スタイル・トランスファー,芸術的スタイル・トランスファーなどを含む,単一の自然なイメージをトレーニングした,効率的な再構成ベースのフレームワークであるSinIRを提案する。
各スケールのネットワークが画像再構成の責任を負うような,カスケードされたマルチスケール学習によって,単一のイメージ上でモデルをトレーニングする。
この再構成目的は、GAN目標と比較して、トレーニングの複雑さと実行時間を大幅に削減する。
しかし、復元目標もまた出力品質を悪化させる。
そこで,この問題を解決するために,デノージングオートエンコーダにインスパイアされた操作を制御できる単純なランダム画素シャッフルを用いる。
定量的評価により、SinIRは様々な画像操作タスクにおいて競合性能を有することを示す。
さらに、より単純な訓練目標(すなわち再構成)により、SinIRは同様の課題を解決するSinGAN(500 X 500画像)よりも33.5倍速く訓練される。
私たちのコードはgithub.com/YooJiHyeong/SinIRで公開されています。
関連論文リスト
- Unified-Width Adaptive Dynamic Network for All-In-One Image Restoration [50.81374327480445]
本稿では, 複雑な画像劣化を基本劣化の観点で表現できる, という新しい概念を提案する。
We propose the Unified-Width Adaptive Dynamic Network (U-WADN) which consist of two pivotal components: a Width Adaptive Backbone (WAB) and a Width Selector (WS)。
提案したU-WADNは、最大32.3%のFLOPを同時に削減し、約15.7%のリアルタイム加速を実現している。
論文 参考訳(メタデータ) (2024-01-24T04:25:12Z) - Splatter Image: Ultra-Fast Single-View 3D Reconstruction [67.96212093828179]
Splatter ImageはGaussian Splattingをベースにしており、複数の画像から3Dシーンを高速かつ高品質に再現することができる。
テスト時に38FPSでフィードフォワードで再構成を行うニューラルネットワークを学習する。
いくつかの総合、実、マルチカテゴリ、大規模ベンチマークデータセットにおいて、トレーニング中にPSNR、LPIPS、その他のメトリクスでより良い結果を得る。
論文 参考訳(メタデータ) (2023-12-20T16:14:58Z) - All-in-one Multi-degradation Image Restoration Network via Hierarchical
Degradation Representation [47.00239809958627]
我々は新しいオールインワン・マルチデグレーション画像復元ネットワーク(AMIRNet)を提案する。
AMIRNetは、クラスタリングによって木構造を段階的に構築することで、未知の劣化画像の劣化表現を学習する。
この木構造表現は、様々な歪みの一貫性と不一致を明示的に反映しており、画像復元の具体的な手がかりとなっている。
論文 参考訳(メタデータ) (2023-08-06T04:51:41Z) - Image Reconstruction from Events. Why learn it? [11.773972029187433]
動き推定の連立問題への取り組みが,線形逆問題としてイベントベース画像再構成のモデル化につながることを示す。
そこで本稿では,古典的・学習的な画像先行情報を用いて,その問題を解決し,再構成画像からアーティファクトを除去する手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T14:01:09Z) - A Shared Representation for Photorealistic Driving Simulators [83.5985178314263]
本稿では、識別器アーキテクチャを再考することにより、生成画像の品質を向上させることを提案する。
シーンセグメンテーションマップや人体ポーズといったセマンティックインプットによって画像が生成されるという問題に焦点が当てられている。
我々は,意味的セグメンテーション,コンテンツ再構成,および粗い粒度の逆解析を行うのに十分な情報をエンコードする,共有潜在表現を学習することを目指している。
論文 参考訳(メタデータ) (2021-12-09T18:59:21Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - SPI-GAN: Towards Single-Pixel Imaging through Generative Adversarial
Network [6.722629246312285]
本稿では,SPI-GANと呼ばれる一画素イメージングのための生成的対向的ネットワークベース再構成フレームワークを提案する。
サンプリング比が5%に低下しても、17.92dBのPSNRと0.487のSSIMで画像を再構成することができる。
論文 参考訳(メタデータ) (2021-07-03T03:06:09Z) - Conditional Sequential Modulation for Efficient Global Image Retouching [45.99310982782054]
フォトリタッチは、露出過度、コントラストの低さ、不調和な彩度といった写真的欠陥に悩まされる画像の美的品質を高めることを目的としている。
本稿では,一般的に使用されているリタッチ操作について検討し,これらの画素非依存演算が多層パーセプトロン(MLP)によって近似あるいは定式化可能であることを数学的に確認する。
我々は,効率的なグローバル画像リタッチのための非常に軽量なフレームワークであるSequential Retouching Network (CSRNet)を提案する。
論文 参考訳(メタデータ) (2020-09-22T08:32:04Z) - Dehaze-GLCGAN: Unpaired Single Image De-hazing via Adversarial Training [3.5788754401889014]
単一画像デハジングのためのデハジンググローバルローカルサイクル一貫性生成適応ネットワーク(Dehaze-GLCGAN)を提案する。
3つのベンチマークデータセットに対する実験により、ネットワークはPSNRとSSIMの点で過去の作業より優れていたことが判明した。
論文 参考訳(メタデータ) (2020-08-15T02:43:00Z) - Single image reflection removal via learning with multi-image
constraints [50.54095311597466]
本稿では、上記のアプローチの利点を組み合わせ、その欠点を克服する新しい学習ベースソリューションを提案する。
提案アルゴリズムはディープニューラルネットワークを学習して、複数の入力画像間で強化されたジョイント制約でターゲットを最適化する。
我々のアルゴリズムは実画像上でリアルタイムかつ最先端の反射除去性能で動作する。
論文 参考訳(メタデータ) (2019-12-08T06:10:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。