論文の概要: GO-Renderer: Generative Object Rendering with 3D-aware Controllable Video Diffusion Models
- arxiv url: http://arxiv.org/abs/2603.23246v1
- Date: Tue, 24 Mar 2026 14:14:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.526066
- Title: GO-Renderer: Generative Object Rendering with 3D-aware Controllable Video Diffusion Models
- Title(参考訳): GO-Renderer:3次元制御可能なビデオ拡散モデルによる生成オブジェクトレンダリング
- Authors: Zekai Gu, Shuoxuan Feng, Yansong Wang, Hanzhuo Huang, Zhongshuo Du, Chengfeng Zhao, Chengwei Ren, Peng Wang, Yuan Liu,
- Abstract要約: GO-Rendererは、任意の照明条件下で高品質なオブジェクトレンダリングを実現するために、ビデオ生成モデルをガイドするフレームワークである。
新しい視点でのイメージの合成、新しい照明環境におけるオブジェクトのレンダリング、既存のビデオへのオブジェクト挿入など、オブジェクトレンダリングタスクにおける最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 10.712561585083222
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reconstructing a renderable 3D model from images is a useful but challenging task. Recent feedforward 3D reconstruction methods have demonstrated remarkable success in efficiently recovering geometry, but still cannot accurately model the complex appearances of these 3D reconstructed models. Recent diffusion-based generative models can synthesize realistic images or videos of an object using reference images without explicitly modeling its appearance, which provides a promising direction for object rendering, but lacks accurate control over the viewpoints. In this paper, we propose GO-Renderer, a unified framework integrating the reconstructed 3D proxies to guide the video generative models to achieve high-quality object rendering on arbitrary viewpoints under arbitrary lighting conditions. Our method not only enjoys the accurate viewpoint control using the reconstructed 3D proxy but also enables high-quality rendering in different lighting environments using diffusion generative models without explicitly modeling complex materials and lighting. Extensive experiments demonstrate that GO-Renderer achieves state-of-the-art performance across the object rendering tasks, including synthesizing images on new viewpoints, rendering the objects in a novel lighting environment, and inserting an object into an existing video.
- Abstract(参考訳): 画像からレンダリング可能な3Dモデルを再構築するのは便利だが、難しい作業だ。
近年のフィードフォワード3次元再構成法は, 幾何を効率的に復元することに成功したが, これらの3次元再構成モデルの複雑な外観を正確にモデル化することはできない。
近年の拡散型生成モデルでは、オブジェクトの外観を明示的にモデル化することなく、オブジェクトのリアルなイメージやビデオを合成することが可能であり、オブジェクトのレンダリングに有望な方向を提供するが、視点の正確な制御はできない。
本稿ではGO-Rendererを提案する。GO-Rendererは、再構成された3Dプロキシを統合し、任意の照明条件下で高品質なオブジェクトレンダリングを実現するためのビデオ生成モデルを誘導する統合フレームワークである。
提案手法は, 再構成された3Dプロキシを用いた正確な視点制御だけでなく, 複雑な材料や照明を明示的にモデル化することなく, 拡散生成モデルを用いて, 異なる照明環境における高品質なレンダリングを可能にする。
GO-Rendererは、新しい視点でのイメージの合成、新しい照明環境におけるオブジェクトのレンダリング、既存のビデオへのオブジェクト挿入など、オブジェクトレンダリングタスクにおける最先端のパフォーマンスを実現する。
関連論文リスト
- GR3EN: Generative Relighting for 3D Environments [52.77521698841744]
本研究では,大規模な室内環境の3次元再構成をリライトする手法を提案する。
提案手法は,映像間リライト拡散モデルの出力を3次元再構成に蒸留することにより,室内空間の3次元リライト化を可能にする。
これにより、複雑な現実世界のシーンの3D再構成をリライトできるフレキシブルなシステムを実現することができる。
論文 参考訳(メタデータ) (2026-01-22T19:10:05Z) - SViM3D: Stable Video Material Diffusion for Single Image 3D Generation [48.986972061812004]
ビデオ拡散モデルは、1つの画像から3Dオブジェクトを効率的に再構成するのに成功している。
我々は,映像拡散モデルを拡張し,空間的に変化するPBRパラメータと表面正規度を,明示的なカメラ制御に基づいて各生成したビューと共同で出力する。
このユニークなセットアップにより、私たちのモデルをニューラルプリエントとして使用した3Dアセットのリライトと生成が可能になります。
論文 参考訳(メタデータ) (2025-10-09T14:29:47Z) - GenLit: Reformulating Single-Image Relighting as Video Generation [42.0880277180892]
我々は、映像生成モデルに光操作を行うためのグラフィックスエンジンの能力を蒸留するフレームワークであるGenLitを紹介する。
小さな合成データセットのみに微調整されたモデルが現実世界のシーンに一般化されることが分かりました。
論文 参考訳(メタデータ) (2024-12-15T15:40:40Z) - ComboVerse: Compositional 3D Assets Creation Using Spatially-Aware Diffusion Guidance [76.7746870349809]
複雑な構成で高品質な3Dアセットを生成する3D生成フレームワークであるComboVerseについて,複数のモデルを組み合わせることを学習して紹介する。
提案手法は,標準スコア蒸留法と比較して,物体の空間的アライメントを重視している。
論文 参考訳(メタデータ) (2024-03-19T03:39:43Z) - Anything-3D: Towards Single-view Anything Reconstruction in the Wild [61.090129285205805]
本稿では,一連の視覚言語モデルとSegment-Anythingオブジェクトセグメンテーションモデルを組み合わせた方法論的フレームワークであるAnything-3Dを紹介する。
提案手法では、BLIPモデルを用いてテキスト記述を生成し、Segment-Anythingモデルを用いて関心対象を効果的に抽出し、テキスト・画像拡散モデルを用いて物体を神経放射場へ持ち上げる。
論文 参考訳(メタデータ) (2023-04-19T16:39:51Z) - 3D Scene Creation and Rendering via Rough Meshes: A Lighting Transfer Avenue [49.62477229140788]
本稿では,再構成された3Dモデルを3Dシーン作成やレンダリングなどの実用的な3Dモデリングパイプラインに柔軟に統合する方法について述べる。
我々はNFRとPBRを橋渡しする照明伝達ネットワーク(LighTNet)を提案する。
論文 参考訳(メタデータ) (2022-11-27T13:31:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。