論文の概要: Hairmony: Fairness-aware hairstyle classification
- arxiv url: http://arxiv.org/abs/2410.11528v1
- Date: Tue, 15 Oct 2024 12:00:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-16 14:02:12.925436
- Title: Hairmony: Fairness-aware hairstyle classification
- Title(参考訳): Harmony:フェアネスを意識した髪型分類
- Authors: Givi Meishvili, James Clemoes, Charlie Hewitt, Zafiirah Hosenie, Xian Xiao, Martin de La Gorce, Tibor Takacs, Tadas Baltrusaitis, Antonio Criminisi, Chyna McRae, Nina Jablonski, Marta Wilczkowiak,
- Abstract要約: 本稿では,人物の髪型を1つの画像から予測する手法を提案する。
モデルをトレーニングするために、合成データのみを使用します。
ドメインエキスパートの多様なグループと共同で開発された,新しい髪型分類法を導入する。
- 参考スコア(独自算出の注目度): 10.230933455074634
- License:
- Abstract: We present a method for prediction of a person's hairstyle from a single image. Despite growing use cases in user digitization and enrollment for virtual experiences, available methods are limited, particularly in the range of hairstyles they can capture. Human hair is extremely diverse and lacks any universally accepted description or categorization, making this a challenging task. Most current methods rely on parametric models of hair at a strand level. These approaches, while very promising, are not yet able to represent short, frizzy, coily hair and gathered hairstyles. We instead choose a classification approach which can represent the diversity of hairstyles required for a truly robust and inclusive system. Previous classification approaches have been restricted by poorly labeled data that lacks diversity, imposing constraints on the usefulness of any resulting enrollment system. We use only synthetic data to train our models. This allows for explicit control of diversity of hairstyle attributes, hair colors, facial appearance, poses, environments and other parameters. It also produces noise-free ground-truth labels. We introduce a novel hairstyle taxonomy developed in collaboration with a diverse group of domain experts which we use to balance our training data, supervise our model, and directly measure fairness. We annotate our synthetic training data and a real evaluation dataset using this taxonomy and release both to enable comparison of future hairstyle prediction approaches. We employ an architecture based on a pre-trained feature extraction network in order to improve generalization of our method to real data and predict taxonomy attributes as an auxiliary task to improve accuracy. Results show our method to be significantly more robust for challenging hairstyles than recent parametric approaches.
- Abstract(参考訳): 本稿では,人物の髪型を1つの画像から予測する手法を提案する。
ユーザのデジタル化や仮想体験の登録におけるユースケースの増加にもかかわらず、利用可能なメソッドは限られており、特にキャプチャ可能なヘアスタイルの範囲は限られている。
人間の髪は非常に多様で、普遍的に受け入れられる説明や分類が欠けているため、これは難しい作業である。
現在のほとんどの手法は、ストランドレベルでの髪のパラメトリックモデルに依存している。
これらのアプローチは、非常に有望ではあるが、短い、ふわふわで、コイル状の髪と集まった髪型を表現できない。
代わりに、真に堅牢で包括的なシステムに必要なヘアスタイルの多様性を表現できる分類アプローチを選択します。
従来の分類手法は、多様性に欠けるラベルの低いデータによって制限されており、その結果の登録システムの有用性に制約が課されている。
モデルをトレーニングするために、合成データのみを使用します。
これにより、髪型属性、髪の色、顔の外観、ポーズ、環境、その他のパラメータの多様性を明確に制御できる。
また、ノイズフリーのグラウンド・トラス・レーベルも製造している。
トレーニングデータのバランスをとり、モデルを監督し、公正を直接測定するために、さまざまな分野の専門家のグループと共同で開発された新しい髪型分類を導入します。
我々は,この分類法を用いて,合成学習データと実際の評価データセットに注釈を付け,将来の髪型予測手法の比較を可能にする。
本研究では,事前学習した特徴抽出ネットワークに基づくアーキテクチャを用いて,本手法の実際のデータへの一般化と分類属性の予測を補助的タスクとして適用し,精度の向上を図る。
その結果,本手法は近年のパラメトリックアプローチよりもヘアスタイルの難易度が高いことが示唆された。
関連論文リスト
- Perm: A Parametric Representation for Multi-Style 3D Hair Modeling [22.790597419351528]
Permは、さまざまな毛髪関連の応用を促進するために設計された人間の3D毛髪のパラメトリックモデルである。
周波数領域におけるPCAに基づくストランド表現を用いて,グローバルヘア形状と局所ストランド詳細をアンタングル化することを提案する。
これらのテクスチャは後に異なる生成モデルでパラメータ化され、ヘアモデリングプロセスの一般的な段階をエミュレートする。
論文 参考訳(メタデータ) (2024-07-28T10:05:11Z) - HAAR: Text-Conditioned Generative Model of 3D Strand-based Human
Hairstyles [85.12672855502517]
そこで本研究では,3次元ヘアスタイルのための新しいストランドベース生成モデルであるHAARについて紹介する。
テキスト入力に基づいて、HAARは現代のコンピュータグラフィックスエンジンで生産レベルの資産として使用できる3Dヘアスタイルを生成する。
論文 参考訳(メタデータ) (2023-12-18T19:19:32Z) - A Local Appearance Model for Volumetric Capture of Diverse Hairstyle [15.122893482253069]
ヘアは個人のアイデンティティと外観において重要な役割を担い、高品質で光現実主義的なアバターの重要な構成要素となっている。
既存のアプローチでは、顔領域のみをモデル化するか、パーソナライズされたモデルに依存し、一般化性とスケーラビリティを制限している。
ヘアスタイルの多彩な高忠実アバターを創出する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T06:29:59Z) - Self-Supervised Disentanglement by Leveraging Structure in Data Augmentations [63.73044203154743]
自己教師付き表現学習は、しばしばデータの「スタイル」属性を誘導するためにデータ拡張を使用する。
データの属性が実際に"スタイル"であり、安全に破棄されるような先入観を推論することは困難である。
スタイル機能を捨てるよりも、スタイル機能を切り離そうとする、より原則化されたアプローチを導入します。
論文 参考訳(メタデータ) (2023-11-15T09:34:08Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - HairFIT: Pose-Invariant Hairstyle Transfer via Flow-based Hair Alignment
and Semantic-Region-Aware Inpainting [26.688276902813495]
ポーズ不変ヘアスタイル転送のための新しいフレームワークであるHairFITを提案する。
本モデルは,フローベース毛髪アライメントと毛髪合成の2段階からなる。
我々のSIM推定器は、画像中の隠蔽領域を異なる意味領域に分割し、塗装中の特徴を反映する。
論文 参考訳(メタデータ) (2022-06-17T06:55:20Z) - Domain Enhanced Arbitrary Image Style Transfer via Contrastive Learning [84.8813842101747]
Contrastive Arbitrary Style Transfer (CAST) は、新しいスタイル表現学習法である。
本フレームワークは,スタイルコード符号化のための多層スタイルプロジェクタ,スタイル分布を効果的に学習するためのドメイン拡張モジュール,画像スタイル転送のための生成ネットワークという,3つのキーコンポーネントから構成される。
論文 参考訳(メタデータ) (2022-05-19T13:11:24Z) - Hair Color Digitization through Imaging and Deep Inverse Graphics [8.605763075773746]
逆グラフィックスとディープニューラルネットワークに基づくヘアカラーデジタル化手法を提案する。
提案するパイプラインは, 毛髪サンプルの色相をキャプチャし, 類似した外観で毛髪の合成画像をレンダリングする。
本手法は、制御された撮像装置、経路追跡レンダリング、および自己教師付き機械学習に基づく逆グラフィックモデルの組み合わせに基づく。
論文 参考訳(メタデータ) (2022-02-08T08:57:04Z) - LOHO: Latent Optimization of Hairstyles via Orthogonalization [20.18175263304822]
本稿では, 髪型移動中の潜伏空間における毛髪構造の詳細を埋め込むために, GANインバージョンを用いた最適化に基づくアプローチを提案する。
提案手法は毛髪を知覚的構造,外観,スタイルの3つの属性に分解し,それぞれの属性を個別にモデル化するための調整された損失を含む。
論文 参考訳(メタデータ) (2021-03-05T19:00:33Z) - Hidden Footprints: Learning Contextual Walkability from 3D Human Trails [70.01257397390361]
現在のデータセットは、人々がどこにいるか、どこにいるかを教えてくれません。
まず、画像間で人の観察を伝播させ、3D情報を利用して、私たちが「隠れ足跡」と呼ぶものを作成することで、有効なラベル付き歩行可能領域の集合を拡大する。
このようなスパースラベルのために設計されたトレーニング戦略を考案し、クラスバランスの分類損失と文脈逆転損失を組み合わせた。
論文 参考訳(メタデータ) (2020-08-19T23:19:08Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。