論文の概要: RoomEditor++: A Parameter-Sharing Diffusion Architecture for High-Fidelity Furniture Synthesis
- arxiv url: http://arxiv.org/abs/2512.17573v1
- Date: Fri, 19 Dec 2025 13:39:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.405548
- Title: RoomEditor++: A Parameter-Sharing Diffusion Architecture for High-Fidelity Furniture Synthesis
- Title(参考訳): RoomEditor++:高忠実家具合成のためのパラメータ共有拡散アーキテクチャ
- Authors: Qilong Wang, Xiaofan Ming, Zhenyi Lin, Jinwen Li, Dongwei Ren, Wangmeng Zuo, Qinghua Hu,
- Abstract要約: 仮想家具の合成は、ホームデザインと電子商取引の応用を大いに約束する。
RoomEditor++は、パラメータ共有デュアル拡散バックボーンを備えた多用途拡散ベースアーキテクチャである。
RoomEditor++は、定量的メトリクス、質的評価、そして人間の嗜好研究の観点から、最先端のアプローチよりも優れている。
- 参考スコア(独自算出の注目度): 89.26382925677301
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual furniture synthesis, which seamlessly integrates reference objects into indoor scenes while maintaining geometric coherence and visual realism, holds substantial promise for home design and e-commerce applications. However, this field remains underexplored due to the scarcity of reproducible benchmarks and the limitations of existing image composition methods in achieving high-fidelity furniture synthesis while preserving background integrity. To overcome these challenges, we first present RoomBench++, a comprehensive and publicly available benchmark dataset tailored for this task. It consists of 112,851 training pairs and 1,832 testing pairs drawn from both real-world indoor videos and realistic home design renderings, thereby supporting robust training and evaluation under practical conditions. Then, we propose RoomEditor++, a versatile diffusion-based architecture featuring a parameter-sharing dual diffusion backbone, which is compatible with both U-Net and DiT architectures. This design unifies the feature extraction and inpainting processes for reference and background images. Our in-depth analysis reveals that the parameter-sharing mechanism enforces aligned feature representations, facilitating precise geometric transformations, texture preservation, and seamless integration. Extensive experiments validate that RoomEditor++ is superior over state-of-the-art approaches in terms of quantitative metrics, qualitative assessments, and human preference studies, while highlighting its strong generalization to unseen indoor scenes and general scenes without task-specific fine-tuning. The dataset and source code are available at \url{https://github.com/stonecutter-21/roomeditor}.
- Abstract(参考訳): 仮想家具合成は、幾何学的コヒーレンスと視覚的リアリズムを維持しつつ、室内のシーンにシームレスに参照オブジェクトを統合する。
しかし、再現可能なベンチマークの不足や、背景の整合性を保ちながら高忠実度家具合成を実現するための既存の画像合成手法の限界により、この分野はいまだ探索されていない。
これらの課題を克服するために、まず最初にRoomBench++を紹介した。
112,851組のトレーニングペアと1,832組のテストペアで構成されており、実際の屋内ビデオとリアルなホームデザインレンダリングの両方から抽出され、実用的な条件下での堅牢なトレーニングと評価をサポートする。
次に,パラメータ共有二重拡散バックボーンを備えた多目的拡散ベースアーキテクチャであるRoomEditor++を提案する。
この設計は、参照画像と背景画像の特徴抽出と塗装プロセスを統一する。
パラメータ共有機構は, 正確な幾何学的変換, テクスチャの保存, シームレスな統合を容易にし, 整列した特徴表現を強制する。
大規模な実験により、RoomEditor++は定量的メトリクス、質的評価、人間の嗜好研究の点で最先端のアプローチよりも優れており、タスク固有の微調整なしに屋内のシーンや一般的なシーンへの強力な一般化を強調している。
データセットとソースコードは \url{https://github.com/stonecutter-21/roomeditor} で公開されている。
関連論文リスト
- DisCo-Layout: Disentangling and Coordinating Semantic and Physical Refinement in a Multi-Agent Framework for 3D Indoor Layout Synthesis [76.7196710324494]
3次元屋内レイアウト合成は仮想環境構築に不可欠である。
DisCoは、物理的および意味的な洗練を歪め、調整する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-10-02T16:30:37Z) - Hi3DEval: Advancing 3D Generation Evaluation with Hierarchical Validity [78.7107376451476]
Hi3DEvalは3D生成コンテンツに適した階層的評価フレームワークである。
素材リアリズムを明示的に評価することで審美的外観を超えてテクスチャ評価を拡張する。
ハイブリッド3次元表現に基づく3次元自動スコアリングシステムを提案する。
論文 参考訳(メタデータ) (2025-08-07T17:50:13Z) - HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation [50.206100327643284]
HiSceneは、2D画像生成と3Dオブジェクト生成のギャップを埋める新しい階層的なフレームワークである。
構成構造を維持しながら2次元表現に整合した3次元コンテンツを生成する。
論文 参考訳(メタデータ) (2025-04-17T16:33:39Z) - Windowed-FourierMixer: Enhancing Clutter-Free Room Modeling with Fourier
Transform [3.864321514889099]
室内空間の内部構造をモデル化する上で,単一画像からの室内環境の塗布が重要な役割を担っている。
我々はU-Formerアーキテクチャと新しいWindowed-FourierMixerブロックに基づく革新的なアプローチを提案する。
この新たなアーキテクチャは、対称性が普及する屋内シーンに関わるタスクに有利であることが証明されている。
論文 参考訳(メタデータ) (2024-02-28T12:27:28Z) - Unveiling Spaces: Architecturally meaningful semantic descriptions from
images of interior spaces [0.0]
本研究の目的は,内部空間の2次元シーンからアーキテクチャ的に意味のある意味記述を抽出することである。
画像から画像への変換のためのGAN(Generative Adversarial Network)は,これらの囲いを合成的に生成した画像に対して,高レベルの構造構造を表す画像抽象化を訓練する。
また,既存の室内囲いの写真にも同様のモデル評価を行い,実環境における性能評価を行った。
論文 参考訳(メタデータ) (2023-12-19T16:03:04Z) - MuSHRoom: Multi-Sensor Hybrid Room Dataset for Joint 3D Reconstruction and Novel View Synthesis [26.710960922302124]
実世界のマルチセンサーハイブリッドルームデータセット(MuSHRoom)を提案する。
我々のデータセットは、エキサイティングな課題を示し、最先端の手法がコスト効率が高く、ノイズの多いデータやデバイスに対して堅牢であることを要求する。
共同3Dメッシュ再構成と新しいビュー合成のためのデータセット上で、いくつかの有名なパイプラインをベンチマークする。
論文 参考訳(メタデータ) (2023-11-05T21:46:12Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Towards Analysis-friendly Face Representation with Scalable Feature and
Texture Compression [113.30411004622508]
普遍的で協調的な視覚情報表現は階層的な方法で実現できることを示す。
ディープニューラルネットワークの強力な生成能力に基づいて、基本特徴層と強化層の間のギャップは、特徴レベルのテクスチャ再構築によってさらに埋められる。
提案するフレームワークの効率を改善するために,ベース層ニューラルネットワークをマルチタスクでトレーニングする。
論文 参考訳(メタデータ) (2020-04-21T14:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。