論文の概要: EasyPortrait -- Face Parsing and Portrait Segmentation Dataset
- arxiv url: http://arxiv.org/abs/2304.13509v2
- Date: Tue, 2 May 2023 05:32:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 16:49:38.903254
- Title: EasyPortrait -- Face Parsing and Portrait Segmentation Dataset
- Title(参考訳): EasyPortrait - 顔解析とポートレートセグメンテーションデータセット
- Authors: Alexander Kapitanov, Karina Kvanchiani, Sofia Kirillova
- Abstract要約: EasyPortraitは、ポートレートセグメンテーションと顔解析タスクのためのイメージデータセットである。
その中には8,377人のユニークなユーザーによる2万枚の屋内写真と、9つのクラスに分かれたきめ細かいセグメンテーションマスクが含まれている。
本稿では,クラウドソーシングプラットフォームを用いた大規模かつクリーンな画像セグメンテーションデータセットを作成するためのパイプラインについて述べる。
- 参考スコア(独自算出の注目度): 68.8204255655161
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recently, due to COVID-19 and the growing demand for remote work, video
conferencing apps have become especially widespread. The most valuable features
of video chats are real-time background removal and face beautification. While
solving these tasks, computer vision researchers face the problem of having
relevant data for the training stage. There is no large dataset with
high-quality labeled and diverse images of people in front of a laptop or
smartphone camera to train a lightweight model without additional approaches.
To boost the progress in this area, we provide a new image dataset,
EasyPortrait, for portrait segmentation and face parsing tasks. It contains
20,000 primarily indoor photos of 8,377 unique users, and fine-grained
segmentation masks separated into 9 classes. Images are collected and labeled
from crowdsourcing platforms. Unlike most face parsing datasets, in
EasyPortrait, the beard is not considered part of the skin mask, and the inside
area of the mouth is separated from the teeth. These features allow using
EasyPortrait for skin enhancement and teeth whitening tasks. This paper
describes the pipeline for creating a large-scale and clean image segmentation
dataset using crowdsourcing platforms without additional synthetic data.
Moreover, we trained several models on EasyPortrait and showed experimental
results. Proposed dataset and trained models are publicly available.
- Abstract(参考訳): 近年、新型コロナウイルス(COVID-19)とリモートワークの需要が高まっているため、ビデオ会議アプリが特に普及している。
ビデオチャットのもっとも価値のある機能は、リアルタイムのバックグラウンド削除と顔の美化だ。
これらの課題を解決する一方で、コンピュータビジョンの研究者は、トレーニングステージに関連データを持つという問題に直面している。
ノートパソコンやスマートフォンカメラの前に、高品質で多様なイメージをラベル付けして、追加のアプローチなしで軽量モデルをトレーニングする大規模なデータセットはありません。
この領域の進歩を促進するために、ポートレートセグメンテーションと顔解析タスクのための新しいイメージデータセットEasyPortraitを提供する。
8,377人のユニークなユーザーによる2万枚の屋内写真と、9つのクラスに分かれたきめ細かいセグメンテーションマスクを含んでいる。
画像はクラウドソーシングプラットフォームから収集されラベル付けされる。
ほとんどの顔分析データセットとは異なり、easyportraitでは、あごひげは皮膚マスクの一部とは見なされておらず、口の内部は歯から切り離されている。
これらの機能は、肌の強化と歯の白化タスクにEasyPortraitを使用することができる。
本稿では,クラウドソーシングプラットフォームを用いた大規模かつクリーンな画像セグメンテーションデータセット作成のためのパイプラインについて述べる。
さらに, EasyPortraitで複数のモデルを訓練し, 実験結果を示した。
提案されたデータセットとトレーニングされたモデルが公開されている。
関連論文リスト
- Outline-Guided Object Inpainting with Diffusion Models [11.391452115311798]
インスタンスセグメンテーションデータセットは、正確で堅牢なコンピュータビジョンモデルのトレーニングにおいて重要な役割を果たす。
この問題は、小さなアノテーション付きインスタンスセグメンテーションデータセットから始めて、拡張して、サイズが拡大されたアノテーション付きデータセットを取得することで緩和できることを示す。
オブジェクトアウトラインの拡散を導くことで,対象クラスでマスク領域を埋めるために,拡散ベースの塗装モデルを用いて新しい画像を生成する。
論文 参考訳(メタデータ) (2024-02-26T09:21:17Z) - Lidar Annotation Is All You Need [0.0]
本稿では,畳み込みニューラルネットワークを用いたマルチセンサ構成による画像分割の効率向上を目的とする。
当社のアプローチにおける重要な革新は、点雲からの粗い接地トラスマスクに対処する、マスク付き損失である。
ベンチマークデータセットに対するアプローチの実験的検証は、高品質の画像セグメンテーションモデルに匹敵する性能を示す。
論文 参考訳(メタデータ) (2023-11-08T15:55:18Z) - A Generalist Framework for Panoptic Segmentation of Images and Videos [61.61453194912186]
我々は,タスクの帰納バイアスに頼ることなく,離散的なデータ生成問題としてパノプティクスセグメンテーションを定式化する。
単純な構造と一般的な損失関数を持つパノスコープマスクをモデル化するための拡散モデルを提案する。
本手法は,動画を(ストリーミング環境で)モデル化し,オブジェクトのインスタンスを自動的に追跡することを学ぶ。
論文 参考訳(メタデータ) (2022-10-12T16:18:25Z) - Self-attention on Multi-Shifted Windows for Scene Segmentation [14.47974086177051]
マルチスケール画像ウィンドウにおける自己注意の有効利用について検討し,視覚的特徴を学習する。
本稿では,これらの特徴マップを集約して,高密度予測のための特徴表現をデコードする3つの戦略を提案する。
我々のモデルは、4つの公開シーンセグメンテーションデータセットで非常に有望な性能を達成する。
論文 参考訳(メタデータ) (2022-07-10T07:36:36Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - Naive-Student: Leveraging Semi-Supervised Learning in Video Sequences
for Urban Scene Segmentation [57.68890534164427]
本研究では,未ラベル映像シーケンスと追加画像の半教師付き学習を利用して,都市景観セグメンテーションの性能を向上させることができるかどうかを問う。
我々は単にラベルのないデータに対して擬似ラベルを予測し、人間の注釈付きデータと擬似ラベル付きデータの両方でその後のモデルを訓練する。
我々のNaive-Studentモデルは、このような単純で効果的な反復的半教師付き学習で訓練され、3つのCityscapesベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-05-20T18:00:05Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。