論文の概要: Procedural Humans for Computer Vision
- arxiv url: http://arxiv.org/abs/2301.01161v1
- Date: Tue, 3 Jan 2023 15:44:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 15:05:44.700392
- Title: Procedural Humans for Computer Vision
- Title(参考訳): コンピュータビジョンのための手続き型人間
- Authors: Charlie Hewitt, Tadas Baltru\v{s}aitis, Erroll Wood, Lohit Petikam,
Louis Florentin and Hanz Cuevas Velasquez
- Abstract要約: 顔と身体のパラメトリックなモデルを構築し,このモデルに基づいて人間の現実的な画像を生成する。
本研究は,Wood et al. のパイプライン上に構築し,人体全体の合成画像を生成することにより,全体を含むように拡張可能であることを示す。
- 参考スコア(独自算出の注目度): 1.9550079119934403
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent work has shown the benefits of synthetic data for use in computer
vision, with applications ranging from autonomous driving to face landmark
detection and reconstruction. There are a number of benefits of using synthetic
data from privacy preservation and bias elimination to quality and feasibility
of annotation. Generating human-centered synthetic data is a particular
challenge in terms of realism and domain-gap, though recent work has shown that
effective machine learning models can be trained using synthetic face data
alone. We show that this can be extended to include the full body by building
on the pipeline of Wood et al. to generate synthetic images of humans in their
entirety, with ground-truth annotations for computer vision applications.
In this report we describe how we construct a parametric model of the face
and body, including articulated hands; our rendering pipeline to generate
realistic images of humans based on this body model; an approach for training
DNNs to regress a dense set of landmarks covering the entire body; and a method
for fitting our body model to dense landmarks predicted from multiple views.
- Abstract(参考訳): 近年の研究では、自律運転から顔のランドマーク検出や再構築に至るまで、コンピュータビジョンで使用する合成データの利点が示されている。
プライバシー保護やバイアス除去からアノテーションの品質や実現可能性まで,合成データを使用することのメリットはいくつかある。
人間中心の合成データを生成することは、リアリズムとドメインギャップの点で特に難しいが、近年の研究では、効果的な機械学習モデルを合成顔データだけで訓練できることが示されている。
本研究は,コンピュータビジョンの応用において,人体全体の合成画像を生成するために,Wood et al. のパイプライン上に構築した全体を含むように拡張可能であることを示す。
本報告では, 顔と身体のパラメトリックなモデルを構築する方法, 人体モデルに基づくリアルな人間の画像を生成するためのレンダリングパイプライン, 体全体を覆っている密集したランドマークの集合を再現するためのDNNの訓練アプローチ, および複数の視点から予測される密集したランドマークに身体モデルを適合させる方法について述べる。
関連論文リスト
- Unveiling Synthetic Faces: How Synthetic Datasets Can Expose Real Identities [22.8742248559748]
6つの最先端の合成顔認識データセットにおいて、元の実データからのサンプルが漏洩していることを示す。
本論文は,ジェネレータモデルのトレーニングデータから生成した合成顔認証データセットへの漏洩を示す最初の研究である。
論文 参考訳(メタデータ) (2024-10-31T15:17:14Z) - SDFR: Synthetic Data for Face Recognition Competition [51.9134406629509]
大規模な顔認識データセットは、インターネットをクロールして個人の同意なしに収集し、法的、倫理的、プライバシー上の懸念を提起する。
近年、ウェブクローリングされた顔認識データセットにおける懸念を軽減するために、合成顔認識データセットの生成が提案されている。
本稿では,第18回IEEE International Conference on Automatic Face and Gesture Recognition (FG 2024)と共同で開催されているSynthetic Data for Face Recognition (SDFR)コンペティションの概要を紹介する。
SDFRコンペティションは2つのタスクに分けられ、参加者は新しい合成データセットまたは/または既存のデータセットを使用して顔認識システムを訓練することができる。
論文 参考訳(メタデータ) (2024-04-06T10:30:31Z) - SynthDistill: Face Recognition with Knowledge Distillation from
Synthetic Data [8.026313049094146]
最先端の顔認識ネットワークは計算コストが高く、モバイルアプリケーションでは利用できないことが多い。
本稿では,教師の事前学習した顔認識モデルの知識を合成データを用いて抽出し,軽量な顔認識モデルを訓練するための新しい枠組みを提案する。
我々は、識別ラベルのない合成顔画像を用いて、合成データセットのクラス内変動生成における問題を緩和する。
論文 参考訳(メタデータ) (2023-08-28T19:15:27Z) - ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文 参考訳(メタデータ) (2023-03-20T12:06:14Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Hands-Up: Leveraging Synthetic Data for Hands-On-Wheel Detection [0.38233569758620045]
この研究は、ドライバモニタリングシステムのトレーニングに合成フォトリアリスティックインキャビンデータを使用することを実証する。
プラットフォームでエラー解析を行い、欠落したエッジケースを生成することで、パフォーマンスが向上することを示す。
これは、人間中心の合成データが現実世界にうまく一般化する能力を示している。
論文 参考訳(メタデータ) (2022-05-31T23:34:12Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - Fake It Till You Make It: Face analysis in the wild using synthetic data
alone [9.081019005437309]
合成データだけで顔関連コンピュータビジョンを野生で実行可能であることを示す。
本稿では、手続き的に生成された3次元顔モデルと手作り資産の包括的ライブラリを組み合わせることで、前例のないリアリズムによるトレーニング画像のレンダリングを行う方法について述べる。
論文 参考訳(メタデータ) (2021-09-30T13:07:04Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - Combining Implicit Function Learning and Parametric Models for 3D Human
Reconstruction [123.62341095156611]
深層学習近似として表される暗黙の関数は、3次元曲面の再構成に強力である。
このような機能は、コンピュータグラフィックスとコンピュータビジョンの両方に柔軟なモデルを構築するのに不可欠である。
詳細に富んだ暗黙関数とパラメトリック表現を組み合わせた方法論を提案する。
論文 参考訳(メタデータ) (2020-07-22T13:46:14Z) - A high fidelity synthetic face framework for computer vision [10.679578971210912]
本稿では, 合成データを用いて, 一貫性とスケールの両立を図りながら, 地中真理アノテーションを含む顔データを合成することを提案する。
パラメトリックな顔モデルと手作りの資産を使って、前例のない品質と多様性でトレーニングデータを生成することができる。
論文 参考訳(メタデータ) (2020-07-16T14:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。