論文の概要: TRACE: High-Fidelity 3D Scene Editing via Tangible Reconstruction and Geometry-Aligned Contextual Video Masking
- arxiv url: http://arxiv.org/abs/2604.01207v1
- Date: Wed, 01 Apr 2026 17:51:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.132405
- Title: TRACE: High-Fidelity 3D Scene Editing via Tangible Reconstruction and Geometry-Aligned Contextual Video Masking
- Title(参考訳): TRACE: タンジブルレコンストラクションによる高忠実な3Dシーン編集とテクスチャ対応ビデオマスキング
- Authors: Jiyuan Hu, Zechuan Zhang, Zongxin Yang, Yi Yang,
- Abstract要約: メッシュ誘導3DGS編集フレームワークは、自動化された高忠実なシーン変換を実現する。
ビデオ拡散を明示的な3次元幾何学で固定することにより、TRACEはきめ細かい部分レベルのマニピュラを可能にする。
- 参考スコア(独自算出の注目度): 38.40189748889072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present TRACE, a mesh-guided 3DGS editing framework that achieves automated, high-fidelity scene transformation. By anchoring video diffusion with explicit 3D geometry, TRACE uniquely enables fine-grained, part-level manipulatio--such as local pose shifting or component replacemen--while preserving the structural integrity of the central subject, a capability largely absent in existing editing methods. Our approach comprises three key stages: (1) Multi-view 3D-Anchor Synthesis, which leverages a sparse-view editor trained on our MV-TRACE datase--the first multi-view consistent dataset dedicated to scene-coherent object addition and modificatio--to generate spatially consistent 3D-anchors; (2) Tangible Geometry Anchoring (TGA), which ensures precise spatial synchronization between inserted meshes and the 3DGS scene via two-phase registration; and (3) Contextual Video Masking (CVM), which integrates 3D projections into an autoregressive video pipeline to achieve temporally stable, physically-grounded rendering. Extensive experiments demonstrate that TRACE consistently outperforms existing methods especially in editing versatility and structural integrity.
- Abstract(参考訳): 本稿では,メッシュ型3DGS編集フレームワークであるTRACEについて述べる。
ビデオ拡散を明示的な3次元幾何学で固定することにより、TRACEは局所的なポーズシフトやコンポーネント置換のような細粒度な部分レベルのマニピュラを一意に可能にし、中央被写体の構造的整合性を維持する一方で、既存の編集方法にはほとんど欠如している。
提案手法は, MV-TRACEデータで訓練されたスパース・ビュー・エディタを利用するマルチビュー3Dアンカー合成 (Multi-view 3D-Anchor Synthesis) と, 空間的に一貫した3Dアンカーを生成するための第1のマルチビュー一貫性データセット (Multi-view consistent dataset) と, 挿入メッシュと2フェーズの登録による3DGSシーンの正確な空間的同期を保証するTGA (Tangible Geometry Anchoring) と, 自動回帰型ビデオパイプラインに3Dプロジェクションを統合して, 時間的に安定な物理的なレンダリングを実現するCVM (Contextual Video Masking) の3段階からなる。
大規模な実験により、TRACEは既存の手法、特に汎用性と構造的整合性を一貫して上回っていることが示されている。
関連論文リスト
- Easy3E: Feed-Forward 3D Asset Editing via Rectified Voxel Flow [29.8200628539749]
TRELLIS生成バックボーンに基づく,効果的かつ完全なフィードフォワード3D編集フレームワークを提案する。
本フレームワークは,3次元表現に自由な2次元編集を適用すること,圧縮された3次元特徴の外観忠実性のボトルネックを克服すること,の2つの主要な課題に対処する。
論文 参考訳(メタデータ) (2026-02-25T02:15:14Z) - POCI-Diff: Position Objects Consistently and Interactively with 3D-Layout Guided Diffusion [46.97254555348757]
本稿では,テキスト・トゥ・イメージ(T2I)生成のための拡散型アプローチを提案する。
連続的かつインタラクティブな位置決めのためのフレームワーク(POCI-Diff)を導入する。
本手法は,個々のテキスト記述を特定の3次元境界ボックスに結合することで,オブジェクトごとのセマンティック制御を可能にする。
論文 参考訳(メタデータ) (2026-01-20T15:13:43Z) - IGGT: Instance-Grounded Geometry Transformer for Semantic 3D Reconstruction [82.53307702809606]
人間は自然に3次元世界の幾何学的構造と意味的内容を中間次元として知覚する。
本稿では,空間再構成とインスタンスレベルの文脈理解の両面での知識を統合するために,IGGT (InstanceGrounded Geometry Transformer) を提案する。
論文 参考訳(メタデータ) (2025-10-26T14:57:44Z) - Mastering Regional 3DGS: Locating, Initializing, and Editing with Diverse 2D Priors [67.22744959435708]
3Dセマンティックパーシングは2Dに比べて性能が劣ることが多く、3D空間内でのターゲット操作がより困難になり、編集の忠実さが制限される。
本稿では,2次元拡散編集を利用して各ビューの修正領域を正確に同定し,次に3次元ローカライゼーションのための逆レンダリングを行う。
実験により,提案手法は最新技術の性能を実現し,最大4倍のスピードアップを実現した。
論文 参考訳(メタデータ) (2025-07-07T19:15:43Z) - InterGSEdit: Interactive 3D Gaussian Splatting Editing with 3D Geometry-Consistent Attention Prior [3.6657066043195585]
InterGSEditは、ユーザの好みでキービューをインタラクティブに選択することで、高品質な3DGS編集のための新しいフレームワークである。
我々は,意図融合ネットワーク(AFN)を介して2次元交差注意と融合した3次元制約された注意を得るために,GAP3D$を計画する。
論文 参考訳(メタデータ) (2025-07-07T13:04:26Z) - T-3DGS: Removing Transient Objects for 3D Scene Reconstruction [83.05271859398779]
映像シーケンスにおける過渡的オブジェクトは、3Dシーン再構成の品質を著しく低下させる可能性がある。
我々は,ガウススプラッティングを用いた3次元再構成において,過渡的障害を頑健に除去する新しいフレームワークT-3DGSを提案する。
論文 参考訳(メタデータ) (2024-11-29T07:45:24Z) - SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing [58.22339174221563]
高忠実度3Dシーン編集のための新しい幾何誘導型マルチビュー一貫したノイズ編集手法SyncNoiseを提案する。
SyncNoiseは2次元拡散モデルで複数のビューを同期的に編集し、幾何的に一貫した多視点ノイズ予測を行う。
本手法は,特に複雑なテクスチャを持つシーンにおいて,テキストの指示に配慮した高品質な3D編集結果を実現する。
論文 参考訳(メタデータ) (2024-06-25T09:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。