論文の概要: CoreEditor: Consistent 3D Editing via Correspondence-constrained Diffusion
- arxiv url: http://arxiv.org/abs/2508.11603v1
- Date: Fri, 15 Aug 2025 17:13:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:24.16087
- Title: CoreEditor: Consistent 3D Editing via Correspondence-constrained Diffusion
- Title(参考訳): CoreEditor: 対応制約付き拡散による一貫性のある3D編集
- Authors: Zhe Zhu, Honghua Chen, Peng Li, Mingqiang Wei,
- Abstract要約: CoreEditorは、一貫したテキストから3D編集のための新しいフレームワークである。
本稿では,画素間の正確な相互作用を強制するアテンション制約付アテンション機構を提案する。
実験では、CoreEditorはよりシャープなディテールで高品質な3D一貫性のある編集を生成する。
- 参考スコア(独自算出の注目度): 24.144486805878596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-driven 3D editing seeks to modify 3D scenes according to textual descriptions, and most existing approaches tackle this by adapting pre-trained 2D image editors to multi-view inputs. However, without explicit control over multi-view information exchange, they often fail to maintain cross-view consistency, leading to insufficient edits and blurry details. We introduce CoreEditor, a novel framework for consistent text-to-3D editing. The key innovation is a correspondence-constrained attention mechanism that enforces precise interactions between pixels expected to remain consistent throughout the diffusion denoising process. Beyond relying solely on geometric alignment, we further incorporate semantic similarity estimated during denoising, enabling more reliable correspondence modeling and robust multi-view editing. In addition, we design a selective editing pipeline that allows users to choose preferred results from multiple candidates, offering greater flexibility and user control. Extensive experiments show that CoreEditor produces high-quality, 3D-consistent edits with sharper details, significantly outperforming prior methods.
- Abstract(参考訳): テキスト駆動3D編集は、テキスト記述に従って3Dシーンを修正しようとするが、既存のアプローチは、事前学習された2Dイメージエディタをマルチビュー入力に適応させることで、この問題に対処している。
しかし、多視点情報交換の明示的な制御がなければ、しばしばクロスビュー一貫性の維持に失敗し、編集が不十分になり、詳細がぼやけてしまう。
一貫性のあるテキストから3D編集のための新しいフレームワークであるCoreEditorを紹介する。
鍵となる革新は、拡散分極過程を通して一貫性が保たれると期待される画素間の正確な相互作用を強制する対応制約された注意機構である。
幾何学的アライメントのみに頼らず、より信頼性の高い対応モデリングと堅牢なマルチビュー編集を実現するために、デノナイズ時に推定される意味的類似性をさらに取り入れる。
さらに,選択可能な編集パイプラインを設計し,複数の候補から選択した結果を選択できるようにし,柔軟性とユーザコントロールを向上する。
大規模な実験により、CoreEditorはよりシャープな細部で高品質で3D一貫性のある編集を作成でき、従来の方法よりも大幅に優れていた。
関連論文リスト
- View-Consistent 3D Editing with Gaussian Splatting [50.6460814430094]
View-Consistent Editing (VcEdit)は、3DGSをシームレスに画像編集プロセスに組み込む新しいフレームワークである。
一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文 参考訳(メタデータ) (2024-03-18T15:22:09Z) - Plasticine3D: 3D Non-Rigid Editing with Text Guidance by Multi-View Embedding Optimization [21.8454418337306]
本研究では,3次元非剛性編集が可能なテキスト誘導型3D編集パイプラインであるPlastine3Dを提案する。
本研究は,編集過程を幾何学的編集段階とテクスチャ的編集段階に分割し,構造と外観を別々に制御する。
細粒度制御のために,埋め込み空間の編集目的と原特徴を融合させるエンベディング・フュージョン (EF) を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。