論文の概要: Adaptive Image Inpainting
- arxiv url: http://arxiv.org/abs/2201.00177v1
- Date: Sat, 1 Jan 2022 12:16:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 14:20:38.775788
- Title: Adaptive Image Inpainting
- Title(参考訳): 適応型イメージインパインティング
- Authors: Maitreya Suin, Kuldeep Purohit, A. N. Rajagopalan
- Abstract要約: ディープニューラルネットワークを使用することで、塗装法は大幅に改善されている。
この問題は、欠落した領域の完全かつ忠実な埋め込みを構築する際のエンコーダ層の非効率性に根ざしている。
本稿では, エンコーダ層に対して, 直接的特徴レベルの監視を行う蒸留方式を提案する。
- 参考スコア(独自算出の注目度): 43.02281823557039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image inpainting methods have shown significant improvements by using deep
neural networks recently. However, many of these techniques often create
distorted structures or blurry textures inconsistent with surrounding areas.
The problem is rooted in the encoder layers' ineffectiveness in building a
complete and faithful embedding of the missing regions. To address this
problem, two-stage approaches deploy two separate networks for a coarse and
fine estimate of the inpainted image. Some approaches utilize handcrafted
features like edges or contours to guide the reconstruction process. These
methods suffer from huge computational overheads owing to multiple generator
networks, limited ability of handcrafted features, and sub-optimal utilization
of the information present in the ground truth. Motivated by these
observations, we propose a distillation based approach for inpainting, where we
provide direct feature level supervision for the encoder layers in an adaptive
manner. We deploy cross and self distillation techniques and discuss the need
for a dedicated completion-block in encoder to achieve the distillation target.
We conduct extensive evaluations on multiple datasets to validate our method.
- Abstract(参考訳): 画像インパインティング手法は,近年,ディープニューラルネットワークの利用により大幅に改善されている。
しかし、これらの技法の多くは周囲と矛盾する歪んだ構造やぼやけたテクスチャをしばしば生み出す。
この問題は、欠損領域の完全かつ忠実な埋め込みを構築する際のエンコーダ層の非効率性に根ざしている。
この問題に対処するため、2段階のアプローチでは、粗い画像の細かな推定のために2つの別々のネットワークを配置する。
いくつかのアプローチでは、エッジや輪郭といった手作りの特徴を使って再構築プロセスを導いている。
これらの手法は、複数のジェネレータネットワークによる膨大な計算オーバーヘッド、手作り特徴の限られた能力、および地上の真実に存在する情報の準最適利用に悩まされている。
そこで本研究では,エンコーダ層に対する直接的機能レベルの監督を適応的に行うための蒸留法を提案する。
我々は, クロス・セルフ蒸留技術を展開し, 蒸留目標を達成するための専用エンコーダの完成ブロックの必要性を論じる。
提案手法を検証するために,複数のデータセットについて広範な評価を行う。
関連論文リスト
- Dense Feature Interaction Network for Image Inpainting Localization [28.028361409524457]
画像の悪質な操作において、画像内容の隠蔽や改ざんに使用することができる。
既存の手法は主に基本的なエンコーダ・デコーダ構造に依存しており、多くの場合、偽陽性が多くなる。
本稿では,Dense Feature Interaction Network (DeFI-Net) に基づく新しい塗り絵検出手法について述べる。
論文 参考訳(メタデータ) (2024-08-05T02:35:13Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Two approaches to inpainting microstructure with deep convolutional
generative adversarial networks [0.0]
ミクロ構造塗布は、閉塞した領域を、一致する境界を持つ合成ミクロ構造に置き換える方法である。
本稿では, 任意の形状と大きさの連続した塗装領域を生成するために, 生成的対向ネットワークを利用する2つの手法を提案する。
ひとつは高速とシンプルさの恩恵であり、もうひとつは影響の大きい境界線でスムーズなバウンダリを提供します。
論文 参考訳(メタデータ) (2022-10-13T13:08:24Z) - Unbiased Multi-Modality Guidance for Image Inpainting [27.286351511243502]
画像インペイントのためのエンド・ツー・エンドマルチモダリティ誘導型トランスフォーマネットワークを開発した。
各トランスブロック内において,提案した空間認識型アテンションモジュールは,マルチモーダルな構造特徴を効率的に学習することができる。
本手法は,複数のモーダルからの識別情報に基づいて,画像中の意味的一貫した文脈を豊かにする。
論文 参考訳(メタデータ) (2022-08-25T03:13:43Z) - Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。
提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。
実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文 参考訳(メタデータ) (2021-09-24T08:11:34Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Semantic Layout Manipulation with High-Resolution Sparse Attention [106.59650698907953]
本稿では,意味ラベルマップを編集して入力画像を操作するセマンティックイメージレイアウト操作の課題に対処する。
このタスクの中核的な問題は、視覚的にイメージを現実的にしながら、入力画像から新しいセマンティックレイアウトに視覚的な詳細を転送する方法です。
512×512の解像度で視覚的詳細を新しいレイアウトに効果的に転送する高分解能スパースアテンションモジュールを提案する。
論文 参考訳(メタデータ) (2020-12-14T06:50:43Z) - Texture Transform Attention for Realistic Image Inpainting [6.275013056564918]
本研究では,細心の注意を払って絵を描いていない領域をより良く生成するテクスチャトランスフォーメーション・アテンション・ネットワークを提案する。
Texture Transform Attentionは、細かいテクスチャと粗いセマンティクスを使用して、新しい再組み立てテクスチャマップを作成するために使用されます。
我々は,公開データセット celeba-hq と places2 を用いて,エンドツーエンドでモデルを評価する。
論文 参考訳(メタデータ) (2020-12-08T06:28:51Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。