論文の概要: Mask-Guided Image Person Removal with Data Synthesis
- arxiv url: http://arxiv.org/abs/2209.14890v1
- Date: Thu, 29 Sep 2022 15:58:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 17:31:17.966257
- Title: Mask-Guided Image Person Removal with Data Synthesis
- Title(参考訳): データ合成によるマスク誘導画像人物除去
- Authors: Yunliang Jiang, Chenyang Gu, Zhenfeng Xue, Xiongtao Zhang, Yong Liu
- Abstract要約: データ合成の観点からこれらの問題に取り組むための新しいアイデアを提案する。
画像人物除去のための専用データセットの欠如に関して,画像,マスク,地中真実を自動的に生成する2つのデータセット生成手法が提案されている。
局所的な画像劣化に似た学習フレームワークを提案し、マスクを用いて特徴抽出プロセスを導出し、最終的な予測のためにより多くのテクスチャ情報を収集する。
- 参考スコア(独自算出の注目度): 11.207512995742999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As a special case of common object removal, image person removal is playing
an increasingly important role in social media and criminal investigation
domains. Due to the integrity of person area and the complexity of human
posture, person removal has its own dilemmas. In this paper, we propose a novel
idea to tackle these problems from the perspective of data synthesis.
Concerning the lack of dedicated dataset for image person removal, two dataset
production methods are proposed to automatically generate images, masks and
ground truths respectively. Then, a learning framework similar to local image
degradation is proposed so that the masks can be used to guide the feature
extraction process and more texture information can be gathered for final
prediction. A coarse-to-fine training strategy is further applied to refine the
details. The data synthesis and learning framework combine well with each
other. Experimental results verify the effectiveness of our method
quantitatively and qualitatively, and the trained network proves to have good
generalization ability either on real or synthetic images.
- Abstract(参考訳): 一般的な物体除去の特殊な場合として、画像人物除去はソーシャルメディアや刑事捜査領域においてますます重要な役割を担っている。
人的領域の完全性と人間の姿勢の複雑さのため、人的除去には独自のジレンマがある。
本稿では,データ合成の観点からこれらの問題に取り組むための新しいアイデアを提案する。
イメージパーソン除去のための専用データセットの欠如について,画像,マスク,グラウンド真理をそれぞれ自動生成する2つのデータセット生成手法を提案する。
次に,局所的な画像劣化に似た学習フレームワークを提案し,マスクを用いて特徴抽出プロセスを導出し,さらにテクスチャ情報を収集して最終的な予測を行う。
細部を精巧にするために、細かな訓練戦略がさらに適用される。
データ合成と学習のフレームワークは互いにうまく合っている。
実験により,本手法の有効性を定量的かつ定性的に検証し,実画像と合成画像のいずれにおいても優れた一般化能力を有することを示す。
関連論文リスト
- Image Captions are Natural Prompts for Text-to-Image Models [70.30915140413383]
本研究では,合成データの学習効果とプロンプトによる合成データ分布の関係を解析した。
本稿では,テキストから画像への生成モデルにより,より情報的で多様な学習データを合成する簡易かつ効果的な手法を提案する。
本手法は,合成学習データに基づいて訓練したモデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-07-17T14:38:11Z) - Global Context-Aware Person Image Generation [24.317541784957285]
文脈認識型人物画像生成のためのデータ駆動型アプローチを提案する。
本手法では,生成した人物の位置,規模,外観を,現場の既存人物に対して意味的に条件付けする。
論文 参考訳(メタデータ) (2023-02-28T16:34:55Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Pose Guided Human Image Synthesis with Partially Decoupled GAN [25.800174118151638]
Pose Guided Human Image Synthesis (PGHIS) は、人間のイメージを基準ポーズから目標ポーズへ変換する難しいタスクである。
本研究では,人体を複数の部分に分解し,現実的な人物像の合成を誘導する手法を提案する。
さらに,PGHISのためのマルチヘッドアテンションベースモジュールを設計する。
論文 参考訳(メタデータ) (2022-10-07T15:31:37Z) - Cut-Paste Consistency Learning for Semi-Supervised Lesion Segmentation [0.20305676256390934]
半教師付き学習は、深層ニューラルネットワークを訓練する際のデータ効率を改善する可能性がある。
本稿では,切削ペースト増分法と整合性正規化の考え方を基礎として,簡易な半教師付き学習法を提案する。
論文 参考訳(メタデータ) (2022-10-01T04:43:54Z) - Synthetic-to-Real Domain Adaptation using Contrastive Unpaired
Translation [28.19031441659854]
手動のアノテーションを使わずにトレーニングデータを取得するための多段階手法を提案する。
3Dオブジェクトメッシュから,現代的な合成パイプラインを用いて画像を生成する。
合成画像の実際の領域への適応に最先端のイメージ・ツー・イメージ変換法を用いる。
論文 参考訳(メタデータ) (2022-03-17T17:13:23Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z) - Boosting Semantic Human Matting with Coarse Annotations [66.8725980604434]
粗いアノテートされた人間のデータセットは、公開データセットから取得し、収集するのがずっと簡単です。
マットリファインメントネットワークは、統一マスクと入力画像とを取り込み、最終アルファマットを予測する。
論文 参考訳(メタデータ) (2020-04-10T09:11:02Z) - Learning Inverse Rendering of Faces from Real-world Videos [52.313931830408386]
既存の方法は、顔画像を3つの構成要素(アルベド、ノーマル、照明)に分解する。
本稿では,アルベドと正常の整合性の仮定に基づいて,我々のモデルを実顔ビデオでトレーニングするための弱い教師付きトレーニング手法を提案する。
私たちのネットワークは、実データと合成データの両方で訓練されています。
論文 参考訳(メタデータ) (2020-03-26T17:26:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。