論文の概要: Learning Intrinsic Images for Clothing
- arxiv url: http://arxiv.org/abs/2111.08521v1
- Date: Tue, 16 Nov 2021 14:43:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 19:44:53.353542
- Title: Learning Intrinsic Images for Clothing
- Title(参考訳): 衣服用固有画像の学習
- Authors: Kuo Jiang, Zian Wang, Xiaodong Yang
- Abstract要約: 本稿では,衣料品画像の内在的画像分解に着目した。
より解釈可能なエッジ対応メトリックとアノテーションスキームは、テストセット用に設計されている。
提案モデルでは, 驚くほど細かな細部を保ちながら, テクスチャコピーのアーティファクトを著しく低減することを示した。
- 参考スコア(独自算出の注目度): 10.21096394185778
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reconstruction of human clothing is an important task and often relies on
intrinsic image decomposition. With a lack of domain-specific data and coarse
evaluation metrics, existing models failed to produce satisfying results for
graphics applications. In this paper, we focus on intrinsic image decomposition
for clothing images and have comprehensive improvements. We collected
CloIntrinsics, a clothing intrinsic image dataset, including a synthetic
training set and a real-world testing set. A more interpretable edge-aware
metric and an annotation scheme is designed for the testing set, which allows
diagnostic evaluation for intrinsic models. Finally, we propose ClothInNet
model with carefully designed loss terms and an adversarial module. It utilizes
easy-to-acquire labels to learn from real-world shading, significantly improves
performance with only minor additional annotation effort. We show that our
proposed model significantly reduce texture-copying artifacts while retaining
surprisingly tiny details, outperforming existing state-of-the-art methods.
- Abstract(参考訳): 人間の衣服の復元は重要な課題であり、しばしば内在的な画像分解に依存している。
ドメイン固有のデータと粗い評価指標の欠如により、既存のモデルはグラフィックスアプリケーションで満足のいく結果を生み出すことができなかった。
本稿では,衣料画像における内在的画像分解に着目し,包括的改善を行った。
合成トレーニングセットと実世界のテストセットを含む,衣服固有の画像データセットであるclointrinsicsを収集した。
より解釈可能なエッジ対応メトリックとアノテーションスキームは、本質的なモデルの診断評価を可能にするテストセット用に設計されている。
最後に、慎重に設計された損失項と対向モジュールを持つClosInNetモデルを提案する。
簡単に入手できるラベルを使って現実世界のシェーディングから学び、小さな追加のアノテーションだけでパフォーマンスを大幅に改善する。
提案手法は, テクスチャコピー処理を著しく削減すると同時に, 驚くほど細部を保ちつつ, 既存の最先端手法を上回っている。
関連論文リスト
- Diverse and Tailored Image Generation for Zero-shot Multi-label Classification [3.354528906571718]
ゼロショットのマルチラベル分類は、人間のアノテーションを使わずに、目に見えないラベルで予測を実行する能力について、かなりの注目を集めている。
一般的なアプローチでは、目に見えないものに対する不完全なプロキシとしてクラスをよく使用します。
本稿では,未確認ラベル上でのプロキシレストレーニングに適したトレーニングセットを構築するために,合成データを生成する,革新的なソリューションを提案する。
論文 参考訳(メタデータ) (2024-04-04T01:34:36Z) - Scaling Laws of Synthetic Images for Model Training ... for Now [54.43596959598466]
本研究では, 合成画像のスケーリング法則について, テクスト・ツー・イメージ・モデルの現状から検討した。
合成画像は、CLIPトレーニングの実際の画像と似ているが、やや効果の低いスケーリング傾向を示す。
論文 参考訳(メタデータ) (2023-12-07T18:59:59Z) - Perceptual Artifacts Localization for Image Synthesis Tasks [59.638307505334076]
我々は10,168個の画像からなる新しいデータセットを導入し,それぞれに知覚的アーティファクトラベルを付加した。
提案したデータセットに基づいてトレーニングされたセグメンテーションモデルは、さまざまなタスクにまたがるアーティファクトを効果的にローカライズする。
生成した画像の知覚的アーティファクトをシームレスに修正する,革新的なズームイン・インペインティングパイプラインを提案する。
論文 参考訳(メタデータ) (2023-10-09T10:22:08Z) - Evaluating Data Attribution for Text-to-Image Models [62.844382063780365]
我々は,既存の大規模モデルを与えられた模範オブジェクトやスタイルにチューニングする「カストミゼーション」手法による属性評価を行う。
私たちのキーとなる洞察は、これによって、構築によって模範にコンピュータ的に影響される合成画像を効率的に作成できるということです。
問題の本質的な不確実性を考慮することで、一連のトレーニング画像に対してソフトな属性スコアを割り当てることができる。
論文 参考訳(メタデータ) (2023-06-15T17:59:51Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - Learning to Annotate Part Segmentation with Gradient Matching [58.100715754135685]
本稿では,事前学習したGANを用いて,高品質な画像を生成することで,半教師付き部分分割タスクに対処することに焦点を当てる。
特に、アノテータ学習を学習から学習までの問題として定式化する。
提案手法は,実画像,生成された画像,さらには解析的に描画された画像を含む,幅広いラベル付き画像からアノテータを学習可能であることを示す。
論文 参考訳(メタデータ) (2022-11-06T01:29:22Z) - Understanding invariance via feedforward inversion of discriminatively
trained classifiers [30.23199531528357]
過去の研究では、出力ログに余計な視覚的詳細が残っていることが判明した。
極めて高い忠実度を再現するフィードフォワードインバージョンモデルを開発する。
私たちのアプローチはBigGANをベースにしており、1ホットクラスのラベルの代わりにロジットのコンディショニングを行います。
論文 参考訳(メタデータ) (2021-03-15T17:56:06Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - TailorGAN: Making User-Defined Fashion Designs [28.805686791183618]
そこで本研究では,2組のデータを使わずに,不整合特性を持つ衣服画像を合成する,新たな自己教師型モデルを提案する。
本手法は,再構築学習ステップと逆学習ステップから構成される。
このデータセットと実世界のサンプルを用いた実験により、我々の手法は最先端の手法よりもはるかに優れた結果を合成できることを示した。
論文 参考訳(メタデータ) (2020-01-17T16:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。