論文の概要: A Benchmark for Inpainting of Clothing Images with Irregular Holes
- arxiv url: http://arxiv.org/abs/2007.05080v3
- Date: Thu, 27 Aug 2020 17:43:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 04:51:01.285600
- Title: A Benchmark for Inpainting of Clothing Images with Irregular Holes
- Title(参考訳): 不規則な穴を有する衣服画像の塗り込み基準
- Authors: Furkan K{\i}nl{\i}, Bar{\i}\c{s} \"Ozcan, Furkan K{\i}ra\c{c}
- Abstract要約: 本稿では、ファッションデータセットに基づく衣料品画像の塗り絵の広範なベンチマークを示す。
マスク更新手順を効率的に導出する部分的畳み込みの拡張版を導入する。
実験により,拡張部分畳み込み(DPConv)は,他の塗布方法と比較して定量的塗布性能を向上させることが示された。
- 参考スコア(独自算出の注目度): 3.867363075280544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fashion image understanding is an active research field with a large number
of practical applications for the industry. Despite its practical impacts on
intelligent fashion analysis systems, clothing image inpainting has not been
extensively examined yet. For that matter, we present an extensive benchmark of
clothing image inpainting on well-known fashion datasets. Furthermore, we
introduce the use of a dilated version of partial convolutions, which
efficiently derive the mask update step, and empirically show that the proposed
method reduces the required number of layers to form fully-transparent masks.
Experiments show that dilated partial convolutions (DPConv) improve the
quantitative inpainting performance when compared to the other inpainting
strategies, especially it performs better when the mask size is 20% or more of
the image. \keywords{image inpainting, fashion image understanding, dilated
convolutions, partial convolutions
- Abstract(参考訳): ファッションイメージ理解は、業界に多くの実用的な応用を持つ活発な研究分野である。
インテリジェンス・ファッション・アナリティクス・システムへの実践的な影響にもかかわらず、衣料品画像のインペインティングはまだ広く検討されていない。
そこで本研究では,ファッションデータセットに基づく衣料品イメージの広範なベンチマークを示す。
さらに,マスク更新手順を効率的に導出する部分畳み込みの拡張版を導入し,提案手法により必要なレイヤ数を削減し,完全透明マスクを形成することを実証的に示す。
実験の結果、拡張部分畳み込み(DPConv)は、他の塗布方法と比較して定量的塗布性能が向上し、特にマスクサイズが20%以上であれば、良好な性能を発揮することが示された。
\keywords{image inpainting, fashion image understanding, dilated convolutions, partial convolutions
関連論文リスト
- VIP: Versatile Image Outpainting Empowered by Multimodal Large Language Model [76.02314305164595]
本研究は,ユーザの要求に応じて結果のカスタマイズが可能な,新たな画像出力フレームワークを提案する。
画像のマスキング部分とマスキング部分のテキスト記述を自動的に抽出し整理するマルチモーダル大言語モデル(MLLM)を利用する。
さらに、画像の特定の空間領域とテキストプロンプトの対応する部分との相互作用を強化するために、特別にCentral-Total-Surrounding (CTS) と呼ばれるCentral-Attentionモジュールが精巧に設計されている。
論文 参考訳(メタデータ) (2024-06-03T07:14:19Z) - Mask-ControlNet: Higher-Quality Image Generation with An Additional Mask Prompt [34.880386778058075]
マスクプロンプトを導入し,Mask-ControlNetというフレームワークを開発した。
マスクは拡散モデルの制御性を高め、参照画像に対する高い忠実性を維持することを示す。
論文 参考訳(メタデータ) (2024-04-08T09:18:32Z) - BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed
Dual-Branch Diffusion [61.90969199199739]
BrushNetは、ピクセルレベルのマスク付きイメージ機能を事前訓練されたDMに埋め込むために設計された、新しいプラグアンドプレイデュアルブランチモデルである。
BrushNetは、画像品質、マスク領域保存、テキストコヒーレンスを含む7つの主要な指標で、既存のモデルよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-11T17:59:31Z) - Personalized Face Inpainting with Diffusion Models by Parallel Visual
Attention [55.33017432880408]
本稿では,パラレル視覚注意(PVA, Parallel Visual Attention, PVA)と拡散モデルとの併用による塗装結果の改善を提案する。
我々はCelebAHQ-IDIで注目モジュールとIDエンコーダをトレーニングする。
実験により, PVAは顔の塗り絵と顔の塗り絵の両面において, 言語指導タスクと相容れない同一性を持つことが示された。
論文 参考訳(メタデータ) (2023-12-06T15:39:03Z) - Shape-Aware Masking for Inpainting in Medical Imaging [49.61617087640379]
インペイントは、教師なしの医用画像モデル発見のためのディープラーニング技術として成功している。
本稿では, 先行する統計的形状の学習を目的とした, 塗装用形状認識マスクの生成手法を提案する。
市販の塗装モデルとスーパーピクセルオーバーセグメンテーションアルゴリズムに基づく教師なしマスキング手法を提案する。
論文 参考訳(メタデータ) (2022-07-12T18:35:17Z) - GLaMa: Joint Spatial and Frequency Loss for General Image Inpainting [44.04779984090629]
画像インパインティングの目的は、残部からコンテキスト情報を用いて傷跡や損傷領域を復元することである。
本稿では、GLaMaと呼ばれるLaMa画像の塗布フレームワークに基づいて、この問題を簡易かつ汎用的に解決する手法を提案する。
提案したGLaMaは、より多くの種類のマスクを使用することで、様々な種類の行方不明情報をよりよくキャプチャできる。
論文 参考訳(メタデータ) (2022-05-15T02:18:59Z) - MAT: Mask-Aware Transformer for Large Hole Image Inpainting [79.67039090195527]
本稿では, 変圧器と畳み込みの利点を統一する, 大穴塗装の新しいモデルを提案する。
実験では、複数のベンチマークデータセット上で、新しいモデルの最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-03-29T06:36:17Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。