論文の概要: VideoMat: Extracting PBR Materials from Video Diffusion Models
- arxiv url: http://arxiv.org/abs/2506.09665v1
- Date: Wed, 11 Jun 2025 12:36:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:02.957474
- Title: VideoMat: Extracting PBR Materials from Video Diffusion Models
- Title(参考訳): VideoMat:ビデオ拡散モデルからPBR物質を抽出する
- Authors: Jacob Munkberg, Zian Wang, Ruofan Liang, Tianchang Shen, Jon Hasselgren,
- Abstract要約: テキストプロンプトや1つの画像が与えられた3Dモデルの高品質な素材を生成するために、微調整ビデオ拡散モデル、ビデオの本質的な分解、および物理ベースで微分可能なレンダリングを利用する。
- 参考スコア(独自算出の注目度): 11.48114859355725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We leverage finetuned video diffusion models, intrinsic decomposition of videos, and physically-based differentiable rendering to generate high quality materials for 3D models given a text prompt or a single image. We condition a video diffusion model to respect the input geometry and lighting condition. This model produces multiple views of a given 3D model with coherent material properties. Secondly, we use a recent model to extract intrinsics (base color, roughness, metallic) from the generated video. Finally, we use the intrinsics alongside the generated video in a differentiable path tracer to robustly extract PBR materials directly compatible with common content creation tools.
- Abstract(参考訳): テキストプロンプトや1つの画像が与えられた3Dモデルの高品質な素材を生成するために、微調整ビデオ拡散モデル、ビデオの本質的な分解、および物理ベースで微分可能なレンダリングを利用する。
我々は、入力幾何と照明条件を尊重するためにビデオ拡散モデルを条件付けする。
このモデルは、コヒーレントな材料特性を持つ与えられた3次元モデルの複数のビューを生成する。
第二に、生成したビデオから内在性(基色、粗さ、金属)を抽出するために、最近のモデルを用いる。
最後に,PBR 素材を共通コンテンツ作成ツールと直接的に互換性を持たせるために,生成したビデオと相似して,相違可能なパストレーサを用いて,PBR 素材を頑健に抽出する。
関連論文リスト
- MuMA: 3D PBR Texturing via Multi-Channel Multi-View Generation and Agentic Post-Processing [35.58100830471395]
3D生成の現在の手法は、大きなチャネルをベースとした物理レンダリングでは依然として不足している。
マルチチャンネルマルチビュー生成とエージェント後処理による3次元手法 MuMA を提案する。
論文 参考訳(メタデータ) (2025-03-24T09:06:33Z) - MaterialMVP: Illumination-Invariant Material Generation via Multi-view PBR Diffusion [37.596740171045845]
物理ベースのレンダリング(PBR)は現代のコンピュータグラフィックスの基盤となり、3Dシーンにおける現実的な物質表現と照明相互作用を可能にしている。
本稿では3次元メッシュと画像プロンプトからPBRテクスチャを生成するための新しいエンド・ツー・エンドモデルを提案する。
論文 参考訳(メタデータ) (2025-03-13T11:57:30Z) - MatCLIP: Light- and Shape-Insensitive Assignment of PBR Material Models [42.42328559042189]
MatCLIPは、PBR材料の形状や光に敏感な記述子を抽出し、画像に基づいて可塑性テクスチャを3Dオブジェクトに割り当てる新しい手法である。
そこで本研究では,PBR表現の領域を写真や描画でブリッジする記述子を生成する。
MatCLIPの分類精度は76.6%で、PhotoShapeやMatAtlasのような最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2025-01-27T12:08:52Z) - TexGaussian: Generating High-quality PBR Material via Octree-based 3D Gaussian Splatting [48.97819552366636]
本稿では, 八面体配向型3次元ガウス平板を用いた高速PBR材料生成のためのTexGaussianを提案する。
本手法は,PBR素材をより視覚的に合成し,非条件シナリオとテキスト条件シナリオの両方において,従来の方法よりも高速に動作させる。
論文 参考訳(メタデータ) (2024-11-29T12:19:39Z) - MaPa: Text-driven Photorealistic Material Painting for 3D Shapes [79.13775179541311]
本稿では,テキスト記述から3次元メッシュの材料を作成することを目的とする。
テクスチャマップを合成する既存の方法とは異なり、我々はセグメントワイドな手続き的な材料グラフを生成することを提案する。
我々のフレームワークは高品質なレンダリングをサポートし、編集にかなりの柔軟性を提供します。
論文 参考訳(メタデータ) (2024-04-26T17:54:38Z) - Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large
Datasets [36.95521842177614]
本稿では,高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細映像・高精細映像・高精細・高精細・高精細・高精細・高精細・高精細
我々は,テキスト・ツー・イメージ・プレトレーニング,ビデオ・プレトレーニング,高品質ビデオファインタニングの3つの異なる段階を同定し,評価する。
論文 参考訳(メタデータ) (2023-11-25T22:28:38Z) - Latent Video Diffusion Models for High-Fidelity Long Video Generation [58.346702410885236]
低次元ラテント空間を用いた軽量映像拡散モデルを提案する。
また,1000フレーム以上の長編動画を生成できるように,遅延空間における階層的拡散も提案する。
我々のフレームワークは、以前の強力なベースラインよりもリアルで長いビデオを生成する。
論文 参考訳(メタデータ) (2022-11-23T18:58:39Z) - Imagen Video: High Definition Video Generation with Diffusion Models [64.06483414521222]
Imagen Videoは、ビデオ拡散モデルのカスケードに基づくテキスト条件付きビデオ生成システムである。
我々は高精細度ビデオを生成することができるが、高い可制御性と世界的知識を持つ画像n Videoを見いだす。
論文 参考訳(メタデータ) (2022-10-05T14:41:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。