論文の概要: UMat: Uncertainty-Aware Single Image High Resolution Material Capture
- arxiv url: http://arxiv.org/abs/2305.16312v1
- Date: Thu, 25 May 2023 17:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 13:00:47.859805
- Title: UMat: Uncertainty-Aware Single Image High Resolution Material Capture
- Title(参考訳): UMAT:不確実な単一画像高解像度素材
- Authors: Carlos Rodriguez-Pardo, Henar Dominguez-Elvira, David
Pascual-Hernandez, Elena Garces
- Abstract要約: 本研究では, 物体の単一拡散像から正規性, 特異性, 粗さを復元する学習手法を提案する。
本手法は材料デジタル化における不確実性をモデル化する問題に最初に対処する手法である。
- 参考スコア(独自算出の注目度): 2.416160525187799
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a learning-based method to recover normals, specularity, and
roughness from a single diffuse image of a material, using microgeometry
appearance as our primary cue. Previous methods that work on single images tend
to produce over-smooth outputs with artifacts, operate at limited resolution,
or train one model per class with little room for generalization. Previous
methods that work on single images tend to produce over-smooth outputs with
artifacts, operate at limited resolution, or train one model per class with
little room for generalization. In contrast, in this work, we propose a novel
capture approach that leverages a generative network with attention and a U-Net
discriminator, which shows outstanding performance integrating global
information at reduced computational complexity. We showcase the performance of
our method with a real dataset of digitized textile materials and show that a
commodity flatbed scanner can produce the type of diffuse illumination required
as input to our method. Additionally, because the problem might be illposed
-more than a single diffuse image might be needed to disambiguate the specular
reflection- or because the training dataset is not representative enough of the
real distribution, we propose a novel framework to quantify the model's
confidence about its prediction at test time. Our method is the first one to
deal with the problem of modeling uncertainty in material digitization,
increasing the trustworthiness of the process and enabling more intelligent
strategies for dataset creation, as we demonstrate with an active learning
experiment.
- Abstract(参考訳): マイクロジオメトリの出現を第一の手がかりとして,物体の拡散画像から正規性,特異性,粗さを復元する学習に基づく手法を提案する。
単一のイメージで作業する従来の方法は、アーティファクトでスムースなアウトプットを生成したり、限定解像度で動作したり、一般化の余地の少ないクラス毎に1つのモデルをトレーニングしたりする傾向があります。
単一のイメージで作業する従来の方法は、アーティファクトでスムースなアウトプットを生成したり、限定解像度で動作したり、一般化の余地の少ないクラス毎に1つのモデルをトレーニングしたりする傾向があります。
そこで本研究では,注意力のある生成ネットワークを活用した新しいキャプチャ手法と,計算複雑性の低減でグローバル情報を統合した優れた性能を示すu-net判別器を提案する。
デジタル化繊維材料の実データを用いて,本手法の性能を示すとともに,本手法の入力に必要な拡散照明のタイプを商品フラットベッドスキャナが生成できることを示す。
さらに,本論文では, スペクトル反射を曖昧にするためには, 1枚以上の拡散像が必要であるか, あるいはトレーニングデータセットが実際の分布を十分に表していないため, テスト時の予測に対するモデルの信頼性を定量化する新しい枠組みを提案する。
本手法は,物質デジタイズにおける不確実性をモデル化し,プロセスの信頼性を高め,アクティブラーニング実験で示すように,データセット作成のためのよりインテリジェントな戦略を実現する最初の手法である。
関連論文リスト
- Exploiting Diffusion Prior for Real-World Image Super-Resolution [84.83724766690952]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文 参考訳(メタデータ) (2023-05-11T17:55:25Z) - Disentangled Pre-training for Image Matting [70.32876925942266]
画像マッチングは、深層モデルのトレーニングをサポートするために高品質なピクセルレベルの人間のアノテーションを必要とする。
本研究では、無限個のデータを活用する自己教師付き事前学習手法を提案し、マッチング性能を向上する。
論文 参考訳(メタデータ) (2023-04-03T08:16:02Z) - Single-photon Image Super-resolution via Self-supervised Learning [6.218646347012887]
SPISR(Single-Photon Image Super-Resolution)は、高分解能の光子計数キューブを、高分解能の低分解能キューブから計算画像アルゴリズムによって回収することを目的としている。
EI(Equivariant Imaging)を単一光子データに拡張することにより、SPISRタスクのための自己教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-03T15:52:01Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Rich Feature Distillation with Feature Affinity Module for Efficient
Image Dehazing [1.1470070927586016]
この作業は、単一イメージのヘイズ除去のためのシンプルで軽量で効率的なフレームワークを導入します。
我々は、ヘテロジニアス知識蒸留の概念を用いて、軽量な事前学習された超解像モデルから豊富な「暗黒知識」情報を利用する。
本実験は, RESIDE-Standardデータセットを用いて, 合成および実世界のドメインに対する我々のフレームワークの堅牢性を示す。
論文 参考訳(メタデータ) (2022-07-13T18:32:44Z) - Single Image Internal Distribution Measurement Using Non-Local
Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。
textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。
7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-02T18:43:55Z) - Learning from scarce information: using synthetic data to classify Roman
fine ware pottery [0.0]
そこで本研究では,モデルがまず,元のオブジェクトの特徴を再現した合成データセット上で訓練されるトランスファー学習手法を提案する。
陶器の図面から複製された特徴を取り入れることで、専門家の知識をプロセスに統合することができた。
この最初の訓練の後、モデルは実際の船の写真からのデータで微調整された。
論文 参考訳(メタデータ) (2021-07-03T10:30:46Z) - Pose Guided Person Image Generation with Hidden p-Norm Regression [113.41144529452663]
ポーズ誘導者画像生成タスクを解くための新しいアプローチを提案する。
提案手法では,各アイデンティティに対するポーズ不変特徴行列を推定し,対象ポーズに条件づけられたターゲットの出現を予測できる。
提案手法は, 上記すべての変種シナリオにおいて, 競合性能を示す。
論文 参考訳(メタデータ) (2021-02-19T17:03:54Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。