Fugu-MT 論文翻訳(概要): UMat: Uncertainty-Aware Single Image High Resolution Material Capture

論文の概要: UMat: Uncertainty-Aware Single Image High Resolution Material Capture

arxiv url: http://arxiv.org/abs/2305.16312v1
Date: Thu, 25 May 2023 17:59:04 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-26 13:00:47.859805
Title: UMat: Uncertainty-Aware Single Image High Resolution Material Capture
Title（参考訳）: UMAT:不確実な単一画像高解像度素材
Authors: Carlos Rodriguez-Pardo, Henar Dominguez-Elvira, David Pascual-Hernandez, Elena Garces
Abstract要約: 本研究では, 物体の単一拡散像から正規性, 特異性, 粗さを復元する学習手法を提案する。本手法は材料デジタル化における不確実性をモデル化する問題に最初に対処する手法である。
参考スコア（独自算出の注目度）: 2.416160525187799
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We propose a learning-based method to recover normals, specularity, and roughness from a single diffuse image of a material, using microgeometry appearance as our primary cue. Previous methods that work on single images tend to produce over-smooth outputs with artifacts, operate at limited resolution, or train one model per class with little room for generalization. Previous methods that work on single images tend to produce over-smooth outputs with artifacts, operate at limited resolution, or train one model per class with little room for generalization. In contrast, in this work, we propose a novel capture approach that leverages a generative network with attention and a U-Net discriminator, which shows outstanding performance integrating global information at reduced computational complexity. We showcase the performance of our method with a real dataset of digitized textile materials and show that a commodity flatbed scanner can produce the type of diffuse illumination required as input to our method. Additionally, because the problem might be illposed -more than a single diffuse image might be needed to disambiguate the specular reflection- or because the training dataset is not representative enough of the real distribution, we propose a novel framework to quantify the model's confidence about its prediction at test time. Our method is the first one to deal with the problem of modeling uncertainty in material digitization, increasing the trustworthiness of the process and enabling more intelligent strategies for dataset creation, as we demonstrate with an active learning experiment.
Abstract（参考訳）: マイクロジオメトリの出現を第一の手がかりとして,物体の拡散画像から正規性,特異性,粗さを復元する学習に基づく手法を提案する。単一のイメージで作業する従来の方法は、アーティファクトでスムースなアウトプットを生成したり、限定解像度で動作したり、一般化の余地の少ないクラス毎に1つのモデルをトレーニングしたりする傾向があります。単一のイメージで作業する従来の方法は、アーティファクトでスムースなアウトプットを生成したり、限定解像度で動作したり、一般化の余地の少ないクラス毎に1つのモデルをトレーニングしたりする傾向があります。そこで本研究では,注意力のある生成ネットワークを活用した新しいキャプチャ手法と,計算複雑性の低減でグローバル情報を統合した優れた性能を示すu-net判別器を提案する。デジタル化繊維材料の実データを用いて,本手法の性能を示すとともに,本手法の入力に必要な拡散照明のタイプを商品フラットベッドスキャナが生成できることを示す。さらに,本論文では, スペクトル反射を曖昧にするためには, 1枚以上の拡散像が必要であるか, あるいはトレーニングデータセットが実際の分布を十分に表していないため, テスト時の予測に対するモデルの信頼性を定量化する新しい枠組みを提案する。本手法は,物質デジタイズにおける不確実性をモデル化し,プロセスの信頼性を高め,アクティブラーニング実験で示すように,データセット作成のためのよりインテリジェントな戦略を実現する最初の手法である。

関連論文リスト

Penalizing Boundary Activation for Object Completeness in Diffusion Models [35.58050562158284]
拡散モデルはテキスト・トゥ・イメージ(T2I)生成の強力な技術として登場した。本研究では,不完全性の問題を詳細に解析し,不完全オブジェクト生成の要因はモデルトレーニングにおけるRandomCropの利用であることを示す。本稿では,初期認知段階において,画像境界におけるアクティベーション値をペナライズする学習自由解を提案する。
論文参考訳（メタデータ） (2025-09-21T07:58:48Z)
Unsupervised Imaging Inverse Problems with Diffusion Distribution Matching [35.01013208265617]
この研究は、未ペアデータセットを用いた逆問題レンズによる画像復元タスクに対処する。提案手法は最小限の仮定の下で動作し、小さな未ペアデータセットにのみ依存する。これは、フォワードモデルがしばしば未知あるいは不特定である実世界のシナリオに特に適している。
論文参考訳（メタデータ） (2025-06-17T15:06:43Z)
Where's the liability in the Generative Era? Recovery-based Black-Box Detection of AI-Generated Content [42.68683643671603]
APIアクセスのみを必要とする新しいブラックボックス検出フレームワークを導入する。画像がモデル自身によって生成された可能性を測定する。マスクされた画像入力をサポートしないブラックボックスモデルに対して、ターゲットモデル分布に適合するように訓練された費用効率の良い代理モデルを導入する。
論文参考訳（メタデータ） (2025-05-02T05:11:35Z)
Forensic Self-Descriptions Are All You Need for Zero-Shot Detection, Open-Set Source Attribution, and Clustering of AI-generated Images [8.167678851224121]
従来の手法では、トレーニング中に既知のソースに特有の機能に依存するため、見えないジェネレータに一般化できない。本稿では,法医学的微細構造を明示的にモデル化する新しい手法を提案する。この自己記述により、合成画像のゼロショット検出、画像のオープンセットソース属性、および事前知識のないソースに基づくクラスタリングを行うことができる。
論文参考訳（メタデータ） (2025-03-26T21:34:37Z)
Reconstruct Anything Model: a lightweight foundation model for computational imaging [3.3248768737711054]
本稿では,フォワード演算子(獲得物理とノイズパラメータ)に関する知識を,アンローリングに頼らずに組み込んだ新しいアーキテクチャを提案する。本モデルは, 脱臭, 磁気共鳴イメージング, トモグラフィ, 塗装, 超高分解能といった, 脱臭以外の幅広い逆問題を解決するために訓練されている。
論文参考訳（メタデータ） (2025-03-11T21:53:58Z)
Learning Diffusion Model from Noisy Measurement using Principled Expectation-Maximization Method [9.173055778539641]
本稿では,任意の破損型を持つ雑音データから拡散モデルを反復的に学習する,原則的予測最大化(EM)フレームワークを提案する。筆者らはモンテカルロ法を用いて,ノイズ測定からクリーンな画像を正確に推定し,次いで再構成画像を用いて拡散モデルを訓練した。
論文参考訳（メタデータ） (2024-10-15T03:54:59Z)
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.09238330331195]
本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。 MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文参考訳（メタデータ） (2024-10-14T17:57:18Z)
DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文参考訳（メタデータ） (2024-06-03T17:59:53Z)
Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。 1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文参考訳（メタデータ） (2023-12-19T15:56:19Z)
Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。本稿では,新たな視点から生成した画像検出問題にアプローチする。実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文参考訳（メタデータ） (2023-11-02T03:09:37Z)
Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文参考訳（メタデータ） (2023-08-13T10:07:46Z)
Enhancing Surface Neural Implicits with Curvature-Guided Sampling and Uncertainty-Augmented Representations [37.42624848693373]
本研究では,高忠実度3次元再構成作業において,深度画像を直接消化する手法を提案する。高効率なトレーニングデータを生成するため,簡単なサンプリング手法を提案する。その単純さにもかかわらず、本手法は古典的および学習的ベースラインの両方に優れる。
論文参考訳（メタデータ） (2023-06-03T12:23:17Z)
Disentangled Pre-training for Image Matting [74.10407744483526]
画像マッチングは、深層モデルのトレーニングをサポートするために高品質なピクセルレベルの人間のアノテーションを必要とする。本研究では、無限個のデータを活用する自己教師付き事前学習手法を提案し、マッチング性能を向上する。
論文参考訳（メタデータ） (2023-04-03T08:16:02Z)
Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。 2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文参考訳（メタデータ） (2022-11-22T18:59:50Z)
Rich Feature Distillation with Feature Affinity Module for Efficient Image Dehazing [1.1470070927586016]
この作業は、単一イメージのヘイズ除去のためのシンプルで軽量で効率的なフレームワークを導入します。我々は、ヘテロジニアス知識蒸留の概念を用いて、軽量な事前学習された超解像モデルから豊富な「暗黒知識」情報を利用する。本実験は, RESIDE-Standardデータセットを用いて, 合成および実世界のドメインに対する我々のフレームワークの堅牢性を示す。
論文参考訳（メタデータ） (2022-07-13T18:32:44Z)
Single Image Internal Distribution Measurement Using Non-Local Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。 textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。 7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文参考訳（メタデータ） (2022-04-02T18:43:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。