論文の概要: Enhanced Residual Networks for Context-based Image Outpainting
- arxiv url: http://arxiv.org/abs/2005.06723v1
- Date: Thu, 14 May 2020 05:14:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 05:23:14.258787
- Title: Enhanced Residual Networks for Context-based Image Outpainting
- Title(参考訳): コンテクストベース画像アウトパインティングのための拡張残差ネットワーク
- Authors: Przemek Gardias, Eric Arthur, Huaming Sun
- Abstract要約: 深いモデルは、保持された情報を通してコンテキストや外挿を理解するのに苦労する。
現在のモデルでは、生成的敵ネットワークを使用して、局所的な画像特徴の整合性が欠如し、偽のように見える結果を生成する。
本稿では,局所的・大域的判別器の使用と,ネットワークの符号化部における残差ブロックの追加という,この問題を改善するための2つの方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although humans perform well at predicting what exists beyond the boundaries
of an image, deep models struggle to understand context and extrapolation
through retained information. This task is known as image outpainting and
involves generating realistic expansions of an image's boundaries. Current
models use generative adversarial networks to generate results which lack
localized image feature consistency and appear fake. We propose two methods to
improve this issue: the use of a local and global discriminator, and the
addition of residual blocks within the encoding section of the network.
Comparisons of our model and the baseline's L1 loss, mean squared error (MSE)
loss, and qualitative differences reveal our model is able to naturally extend
object boundaries and produce more internally consistent images compared to
current methods but produces lower fidelity images.
- Abstract(参考訳): 人間は画像の境界を超えるものを予測するのに優れていますが、深いモデルは保持された情報を通してコンテキストや外挿を理解するのに苦労しています。
このタスクは画像の露光と呼ばれ、画像の境界の現実的な拡張を生成する。
現在のモデルは生成広告ネットワークを使用して、ローカライズされた画像特徴の一貫性が欠如し、フェイクに見える結果を生成する。
この問題を改善するための2つの手法として,局所的および大域的な判別器の使用と,ネットワークの符号化部に残差ブロックを追加することを提案する。
我々のモデルとベースラインのL1損失、平均二乗誤差(MSE)損失、定性的差の比較により、我々のモデルは対象の境界を自然に拡張し、現在の手法と比較してより一貫した画像を生成することができるが、より低い忠実度画像を生成する。
関連論文リスト
- Unlocking Pre-trained Image Backbones for Semantic Image Synthesis [29.688029979801577]
本稿では,現実的な画像を生成するセマンティック画像合成のための新しい種類のGAN識別器を提案する。
DP-SIMSをダブした本モデルでは,ADE-20K,COCO-Stuff,Cityscapesの入力ラベルマップと画像品質と一貫性の両面から,最新の結果が得られる。
論文 参考訳(メタデータ) (2023-12-20T09:39:19Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - SelFSR: Self-Conditioned Face Super-Resolution in the Wild via Flow
Field Degradation Network [12.976199676093442]
野生における顔超解像のための新しいドメイン適応分解ネットワークを提案する。
我々のモデルは,CelebAと実世界の顔データセットの両方で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-12-20T17:04:00Z) - Boosting Image Outpainting with Semantic Layout Prediction [18.819765707811904]
我々は、画像ドメインの代わりにセマンティックセグメンテーションドメイン内の領域を拡張するために、GANを訓練する。
別のGANモデルは、拡張されたセマンティックレイアウトに基づいて実際の画像を合成するように訓練されている。
我々のアプローチは意味的な手がかりをより容易に扱えるので、複雑なシナリオではよりうまく機能します。
論文 参考訳(メタデータ) (2021-10-18T13:09:31Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Image Inpainting Using Wasserstein Generative Adversarial Imputation
Network [0.0]
本稿では,Wasserstein Generative Adversarial Imputation Networkに基づく画像インペイントモデルを提案する。
普遍計算モデルは、十分な品質で欠落の様々なシナリオを扱うことができる。
論文 参考訳(メタデータ) (2021-06-23T05:55:07Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。