論文の概要: Velocity-Space 3D Asset Editing
- arxiv url: http://arxiv.org/abs/2605.07385v1
- Date: Fri, 08 May 2026 07:42:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.894093
- Title: Velocity-Space 3D Asset Editing
- Title(参考訳): 速度空間3次元アセット編集
- Authors: Hao Liu, Yuxuan Lin, Jingfeng Guo, Ruihang Chu, Junjie Wang, Ruotong Li, Yujiu Yang,
- Abstract要約: ローカルに3Dアセットを編集し、残りの部分を保存しながらターゲット領域を変更することは、ネイティブな3D編集の基本的な要件である。
Inversion-free, training-free, and mask-free framework that address each problem with a target intervention in the sampler。
- 参考スコア(独自算出の注目度): 45.94997633532406
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Editing a 3D asset locally, modifying a target region while preserving the rest, is a fundamental requirement of native 3D editing. Existing methods enforce locality through mechanisms external to the generator, such as manual 3D masks, post-hoc voxel merging, or 2D multi-view lifting. None of them intervene where the corruption actually originates: inside the ODE sampler. For a rectified-flow generator to achieve faithful local editing, its velocity field should be strong over the target editing region while vanishing on preserved content. Yet a single velocity field can hardly satisfy both requirements simultaneously, leading to three problems: (i) identity leakage that keeps the edit signal non-zero on preserved regions; (ii) no dedicated edit-amplification channel, so strengthening the edit inevitably perturbs identity; and (iii) an identity drag at the geometry and material stages, where a global condition pulls every token toward the target. We propose VS3D (Velocity-Space 3D Asset editing}), an inversion-free, training-free, and mask-free framework that addresses each problem with a targeted intervention inside the sampler. VS3D integrates three complementary modules, each corresponding to a specific stage of the editing pipeline. Reconstruction-Anchored Source Injection (RASI) absorbs identity leakage by turning the unconditional embedding into a per-step, asset-specific anchor calibrated through source reconstruction. Partial-Mean Guidance (PMG) amplifies the edit signal by contrasting high- and low-quality subsample estimates of the velocity difference, active only where a consistent edit exists. Twin-Agreement Residual injection (TAR) lets the sampler decide token by token what to preserve at the geometry and material stages.
- Abstract(参考訳): ローカルに3Dアセットを編集し、残りの部分を保存しながらターゲット領域を変更することは、ネイティブな3D編集の基本的な要件である。
既存の方法は、手動の3Dマスク、ポストホックのボクセルのマージ、または2Dのマルチビューリフトのようなジェネレータ外部のメカニズムを通して局所性を強制する。
それらの誰も、汚職が実際に発生した場所(ODEサンプルラの内部)に介入しません。
整流流発生器が忠実な局所編集を実現するためには、その速度場は保存された内容に頼らず、目標編集領域に強くなるべきである。
しかし、1つの速度場は両方の要求を同時に満たすことができず、3つの問題に繋がる。
一 保存地域において、編集信号がゼロに保たないID漏洩
(二 専用編集増幅チャンネルがないため、編集が必然的に混乱すること。)
第三に、世界的条件が全てのトークンを目標に向かって引き寄せる幾何学的・物質的段階におけるアイデンティティのドラッグ。
そこで我々は,VS3D (Velocity-Space 3D Asset editing}) を提案する。
VS3Dは3つの補完モジュールを統合し、それぞれが編集パイプラインの特定のステージに対応する。
レコンストラクション・アンコールド・ソース・インジェクション(RASI)は、ソース・インジェクションによって調整された非条件埋め込みをステップごとのアセット固有のアンカーに変えることで、アイデンティティ・リークを吸収する。
部分平均誘導(PMG)は、一貫した編集が存在する場合にのみ、速度差の高および低品質のサブサンプル推定を対比することにより、編集信号を増幅する。
TAR (Twin-Agreement Residual Injection) では、サンプルがトークンをトークンで決定できる。
関連論文リスト
- Beyond Voxel 3D Editing: Learning from 3D Masks and Self-Constructed Data [40.44238807341562]
3D編集では、プロンプトに従って局所的な変更を実行することでセマンティック一貫性を維持する必要がある。
本研究では,3D編集に適した大規模データセットを自己構築したBeyond Voxel 3D Editing (BVE) フレームワークを提案する。
BVEは、原入力の視覚的特性を忠実に保持しつつ、高品質でテキスト整列した3Dアセットを生成する上で、優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-04-15T10:10:27Z) - TRACE: High-Fidelity 3D Scene Editing via Tangible Reconstruction and Geometry-Aligned Contextual Video Masking [38.40189748889072]
メッシュ誘導3DGS編集フレームワークは、自動化された高忠実なシーン変換を実現する。
ビデオ拡散を明示的な3次元幾何学で固定することにより、TRACEはきめ細かい部分レベルのマニピュラを可能にする。
論文 参考訳(メタデータ) (2026-04-01T17:51:00Z) - CEI-3D: Collaborative Explicit-Implicit 3D Reconstruction for Realistic and Fine-Grained Object Editing [51.73433734209541]
既存の3D編集手法は、再構成ネットワークの深い統合性のために、非現実的で未精細な結果をもたらすことが多い。
本稿では,現実的できめ細かな編集を容易にするための,編集指向の再構築パイプラインであるCEI-3Dを紹介する。
提案手法は,最新技術(SOTA)手法よりも,よりリアルできめ細かな編集結果を実現すると同時に,編集時間を短縮する。
論文 参考訳(メタデータ) (2026-03-12T11:15:11Z) - Easy3E: Feed-Forward 3D Asset Editing via Rectified Voxel Flow [29.8200628539749]
TRELLIS生成バックボーンに基づく,効果的かつ完全なフィードフォワード3D編集フレームワークを提案する。
本フレームワークは,3次元表現に自由な2次元編集を適用すること,圧縮された3次元特徴の外観忠実性のボトルネックを克服すること,の2つの主要な課題に対処する。
論文 参考訳(メタデータ) (2026-02-25T02:15:14Z) - VoxHammer: Training-Free Precise and Coherent 3D Editing in Native 3D Space [21.430767811940356]
特定領域の3D局所編集は,ゲーム産業とロボットのインタラクションにとって重要である。
最近の方法は一般的にレンダリングされたマルチビュー画像を編集し、3Dモデルを再構成する。
本稿では,3次元ラテント空間における高精度かつコヒーレントな編集を行う新しいトレーニングフリーアプローチであるVoxHammerを提案する。
論文 参考訳(メタデータ) (2025-08-26T17:59:47Z) - Drag Your Gaussian: Effective Drag-Based Editing with Score Distillation for 3D Gaussian Splatting [55.14822004410817]
DYGは3次元ガウススプラッティングのための効果的な3次元ドラッグベース編集法である。
3次元マスクと一対の制御点を入力して編集範囲を正確に制御できる。
DYGは暗黙三面体表現の強さを統合し、編集結果の幾何学的足場を確立する。
論文 参考訳(メタデータ) (2025-01-30T18:51:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。