論文の概要: UMat: Uncertainty-Aware Single Image High Resolution Material Capture
- arxiv url: http://arxiv.org/abs/2305.16312v1
- Date: Thu, 25 May 2023 17:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 13:00:47.859805
- Title: UMat: Uncertainty-Aware Single Image High Resolution Material Capture
- Title(参考訳): UMAT:不確実な単一画像高解像度素材
- Authors: Carlos Rodriguez-Pardo, Henar Dominguez-Elvira, David
Pascual-Hernandez, Elena Garces
- Abstract要約: 本研究では, 物体の単一拡散像から正規性, 特異性, 粗さを復元する学習手法を提案する。
本手法は材料デジタル化における不確実性をモデル化する問題に最初に対処する手法である。
- 参考スコア(独自算出の注目度): 2.416160525187799
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a learning-based method to recover normals, specularity, and
roughness from a single diffuse image of a material, using microgeometry
appearance as our primary cue. Previous methods that work on single images tend
to produce over-smooth outputs with artifacts, operate at limited resolution,
or train one model per class with little room for generalization. Previous
methods that work on single images tend to produce over-smooth outputs with
artifacts, operate at limited resolution, or train one model per class with
little room for generalization. In contrast, in this work, we propose a novel
capture approach that leverages a generative network with attention and a U-Net
discriminator, which shows outstanding performance integrating global
information at reduced computational complexity. We showcase the performance of
our method with a real dataset of digitized textile materials and show that a
commodity flatbed scanner can produce the type of diffuse illumination required
as input to our method. Additionally, because the problem might be illposed
-more than a single diffuse image might be needed to disambiguate the specular
reflection- or because the training dataset is not representative enough of the
real distribution, we propose a novel framework to quantify the model's
confidence about its prediction at test time. Our method is the first one to
deal with the problem of modeling uncertainty in material digitization,
increasing the trustworthiness of the process and enabling more intelligent
strategies for dataset creation, as we demonstrate with an active learning
experiment.
- Abstract(参考訳): マイクロジオメトリの出現を第一の手がかりとして,物体の拡散画像から正規性,特異性,粗さを復元する学習に基づく手法を提案する。
単一のイメージで作業する従来の方法は、アーティファクトでスムースなアウトプットを生成したり、限定解像度で動作したり、一般化の余地の少ないクラス毎に1つのモデルをトレーニングしたりする傾向があります。
単一のイメージで作業する従来の方法は、アーティファクトでスムースなアウトプットを生成したり、限定解像度で動作したり、一般化の余地の少ないクラス毎に1つのモデルをトレーニングしたりする傾向があります。
そこで本研究では,注意力のある生成ネットワークを活用した新しいキャプチャ手法と,計算複雑性の低減でグローバル情報を統合した優れた性能を示すu-net判別器を提案する。
デジタル化繊維材料の実データを用いて,本手法の性能を示すとともに,本手法の入力に必要な拡散照明のタイプを商品フラットベッドスキャナが生成できることを示す。
さらに,本論文では, スペクトル反射を曖昧にするためには, 1枚以上の拡散像が必要であるか, あるいはトレーニングデータセットが実際の分布を十分に表していないため, テスト時の予測に対するモデルの信頼性を定量化する新しい枠組みを提案する。
本手法は,物質デジタイズにおける不確実性をモデル化し,プロセスの信頼性を高め,アクティブラーニング実験で示すように,データセット作成のためのよりインテリジェントな戦略を実現する最初の手法である。
関連論文リスト
- Learning Diffusion Model from Noisy Measurement using Principled Expectation-Maximization Method [9.173055778539641]
本稿では,任意の破損型を持つ雑音データから拡散モデルを反復的に学習する,原則的予測最大化(EM)フレームワークを提案する。
筆者らはモンテカルロ法を用いて,ノイズ測定からクリーンな画像を正確に推定し,次いで再構成画像を用いて拡散モデルを訓練した。
論文 参考訳(メタデータ) (2024-10-15T03:54:59Z) - MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.09238330331195]
本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。
離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。
MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-14T17:57:18Z) - DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文 参考訳(メタデータ) (2023-12-19T15:56:19Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Enhancing Surface Neural Implicits with Curvature-Guided Sampling and Uncertainty-Augmented Representations [37.42624848693373]
本研究では,高忠実度3次元再構成作業において,深度画像を直接消化する手法を提案する。
高効率なトレーニングデータを生成するため,簡単なサンプリング手法を提案する。
その単純さにもかかわらず、本手法は古典的および学習的ベースラインの両方に優れる。
論文 参考訳(メタデータ) (2023-06-03T12:23:17Z) - Disentangled Pre-training for Image Matting [74.10407744483526]
画像マッチングは、深層モデルのトレーニングをサポートするために高品質なピクセルレベルの人間のアノテーションを必要とする。
本研究では、無限個のデータを活用する自己教師付き事前学習手法を提案し、マッチング性能を向上する。
論文 参考訳(メタデータ) (2023-04-03T08:16:02Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Rich Feature Distillation with Feature Affinity Module for Efficient
Image Dehazing [1.1470070927586016]
この作業は、単一イメージのヘイズ除去のためのシンプルで軽量で効率的なフレームワークを導入します。
我々は、ヘテロジニアス知識蒸留の概念を用いて、軽量な事前学習された超解像モデルから豊富な「暗黒知識」情報を利用する。
本実験は, RESIDE-Standardデータセットを用いて, 合成および実世界のドメインに対する我々のフレームワークの堅牢性を示す。
論文 参考訳(メタデータ) (2022-07-13T18:32:44Z) - Single Image Internal Distribution Measurement Using Non-Local
Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。
textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。
7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-02T18:43:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。