論文の概要: Boosting Semantic Human Matting with Coarse Annotations
- arxiv url: http://arxiv.org/abs/2004.04955v1
- Date: Fri, 10 Apr 2020 09:11:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 20:45:44.881184
- Title: Boosting Semantic Human Matting with Coarse Annotations
- Title(参考訳): 粗いアノテーションによる意味的ヒューマンマッチングの強化
- Authors: Jinlin Liu, Yuan Yao, Wendi Hou, Miaomiao Cui, Xuansong Xie, Changshui
Zhang, Xian-sheng Hua
- Abstract要約: 粗いアノテートされた人間のデータセットは、公開データセットから取得し、収集するのがずっと簡単です。
マットリファインメントネットワークは、統一マスクと入力画像とを取り込み、最終アルファマットを予測する。
- 参考スコア(独自算出の注目度): 66.8725980604434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic human matting aims to estimate the per-pixel opacity of the
foreground human regions. It is quite challenging and usually requires user
interactive trimaps and plenty of high quality annotated data. Annotating such
kind of data is labor intensive and requires great skills beyond normal users,
especially considering the very detailed hair part of humans. In contrast,
coarse annotated human dataset is much easier to acquire and collect from the
public dataset. In this paper, we propose to use coarse annotated data coupled
with fine annotated data to boost end-to-end semantic human matting without
trimaps as extra input. Specifically, we train a mask prediction network to
estimate the coarse semantic mask using the hybrid data, and then propose a
quality unification network to unify the quality of the previous coarse mask
outputs. A matting refinement network takes in the unified mask and the input
image to predict the final alpha matte. The collected coarse annotated dataset
enriches our dataset significantly, allows generating high quality alpha matte
for real images. Experimental results show that the proposed method performs
comparably against state-of-the-art methods. Moreover, the proposed method can
be used for refining coarse annotated public dataset, as well as semantic
segmentation methods, which reduces the cost of annotating high quality human
data to a great extent.
- Abstract(参考訳): セマンティック・ヒューマン・マッティングは、前景のヒト領域の画素当たりの不透明度を推定することを目的としている。
非常に困難で、通常はユーザインタラクティブなトリマップと高品質な注釈付きデータが必要です。
この種のデータに注釈をつけるのは労働集約的であり、特に人間の非常に詳細な髪型を考えると、普通のユーザーを超えて優れたスキルを必要とする。
対照的に、粗い注釈付き人間のデータセットは、公開データセットから取得および収集するのがずっと簡単です。
本稿では、粗いアノテートデータと細かなアノテートデータを組み合わせて、トリマップを余分な入力として使用せずに、エンドツーエンドのセマンティック・マッティングを促進することを提案する。
具体的には、ハイブリッドデータを用いて粗いセマンティックマスクを推定するためにマスク予測ネットワークを訓練し、その後、粗いマスク出力の品質を統一する品質統一ネットワークを提案する。
マッティングリファインメントネットワークは、統一マスクと入力画像とを取り込んで最終アルファマットを予測する。
収集した粗い注釈付きデータセットはデータセットを大幅に強化し、実際の画像に対して高品質なアルファマットを生成することができる。
実験の結果,提案手法は最先端手法と同等の性能を示すことがわかった。
さらに、提案手法は、粗末な注釈付き公開データセットの精錬や、セマンティックセグメンテーション手法に使用できるため、高品質な人間データのアノテートコストを大幅に削減することができる。
関連論文リスト
- Boosting General Trimap-free Matting in the Real-World Image [0.0]
我々は,textbfMulti-textbfFeature fusion-based textbfCoarse-to-fine Network textbf(MFC-Net)というネットワークを提案する。
提案手法は, 合成画像と実世界の画像の両方において有意に有効であり, 実世界のデータセットの性能は, 既存のマッティングフリー手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2024-05-28T07:37:44Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - RADiff: Controllable Diffusion Models for Radio Astronomical Maps
Generation [6.128112213696457]
RADiffは、注釈付き無線データセット上でトレーニングされた条件拡散モデルに基づく生成的アプローチである。
完全合成画像アノテーションペアを生成して,任意のアノテートデータセットを自動的に拡張できることを示す。
論文 参考訳(メタデータ) (2023-07-05T16:04:44Z) - DiffuMask: Synthesizing Images with Pixel-level Annotations for Semantic
Segmentation Using Diffusion Models [68.21154597227165]
本研究では,オフザシェルフ安定拡散モデルにより生成された合成画像の正確なセマンティックマスクを自動で取得できることを示す。
我々のアプローチはDiffuMaskと呼ばれ、テキストと画像間の相互注意マップの可能性を利用しています。
論文 参考訳(メタデータ) (2023-03-21T08:43:15Z) - Mask-Guided Image Person Removal with Data Synthesis [11.207512995742999]
データ合成の観点からこれらの問題に取り組むための新しいアイデアを提案する。
画像人物除去のための専用データセットの欠如に関して,画像,マスク,地中真実を自動的に生成する2つのデータセット生成手法が提案されている。
局所的な画像劣化に似た学習フレームワークを提案し、マスクを用いて特徴抽出プロセスを導出し、最終的な予測のためにより多くのテクスチャ情報を収集する。
論文 参考訳(メタデータ) (2022-09-29T15:58:17Z) - Alpha Matte Generation from Single Input for Portrait Matting [79.62140902232628]
目標は、各画素が前景の被写体に与える影響を識別するアルファマットを予測することである。
従来のアプローチや既存の作業の多くは、アルファマットの予測にトリマップ、背景画像などの追加入力を使用していた。
我々は、GAN(Generative Adversarial Nets)を用いたポートレート・マッティングを行うための追加の入力不要アプローチを導入する。
論文 参考訳(メタデータ) (2021-06-06T18:53:42Z) - Human De-occlusion: Invisible Perception and Recovery for Humans [26.404444296924243]
我々は,人間の閉ざされたセグメンテーションマスクと目に見えない外観内容の理由から,人間の閉ざしの問題に取り組む。
特に,見えない部分を推定し,内部を復元するための2段階フレームワークが提案されている。
本手法は,マスク補完作業とコンテンツ回復作業の両方において,最先端技術上で動作する。
論文 参考訳(メタデータ) (2021-03-22T05:54:58Z) - Mask-based Data Augmentation for Semi-supervised Semantic Segmentation [3.946367634483361]
そこで我々は,CutMix と ClassMix の側面を組み込んだデータ拡張手法である ComplexMix を提案する。
提案手法は、意味論的に正しいようにしながら、拡張データの複雑さを制御できる。
実験結果から,セマンティック画像分割のための標準データセットにおける最新手法の改良が得られた。
論文 参考訳(メタデータ) (2021-01-25T15:09:34Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。