論文の概要: Feedforward 3D Editing Learns from Semantic-Part Transformation
- arxiv url: http://arxiv.org/abs/2605.27351v2
- Date: Wed, 27 May 2026 16:05:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.169685
- Title: Feedforward 3D Editing Learns from Semantic-Part Transformation
- Title(参考訳): 意味的部分変換から学ぶフィードフォワード3D編集
- Authors: Jiawei Weng, Saining Zhang, Zhenxin Diao, Peishuo Li, Henghaofan Zhang, Junhao Chen, Hao Zhao,
- Abstract要約: フィードフォワード3D編集における中心的な課題は、高品質なペア管理の欠如にある。
スケーラブルなフィードフォワード3D編集はセマンティック部分変換から学習されるべきである。
PartFlowはフィードフォワード3D編集ネットワークで、ソース認識の潜伏制御を事前訓練された3D生成先行に注入する。
- 参考スコア(独自算出の注目度): 13.61340944347895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D editing is a fundamental capability for scalable 3D content creation. While image editing has rapidly evolved toward large-scale feedforward generative paradigms, 3D AI generation remains dominated by training-free editing pipelines. A central challenge of feedforward 3D editing lies in the lack of high-quality paired supervision. Editable 3D assets require simultaneous preservation of geometry, multi-view consistency, structural coherence, and localized edit controllability. Existing 3D editing datasets often rely on independently generated assets, image-mediated reconstruction or narrow edit taxonomies, leading to inaccurate localization, weak preservation, blurred edit boundaries, and limited semantic consistency. In this work, we introduce a new perspective: scalable feedforward 3D editing should be learned from semantic-part transformations. Based on this insight, we propose Pxform, a high-quality 3D editing dataset with over 100K consistent before/after editing pairs across seven edit types. Instead of treating objects as unstructured shapes, our pipeline grounds edits directly in semantic 3D parts. Built upon Pxform, we further propose PartFlow, a feedforward 3D editing network that injects source-aware latent control into pretrained 3D generative priors. PartFlow introduces mask-aware velocity preservation and render-space consistency supervision to jointly improve edit fidelity and source preservation, while requiring no 3D edit mask during inference. Extensive experiments demonstrate that high-quality semantic-part supervision substantially improves scalable 3D editing, enabling PartFlow to achieve state-of-the-art performance on both geometric and appearance editing benchmarks.
- Abstract(参考訳): 3D編集は、スケーラブルな3Dコンテンツ作成の基本的な機能である。
画像編集は大規模フィードフォワード生成パラダイムへと急速に進化してきたが、3D AI生成はトレーニング不要な編集パイプラインに支配されている。
フィードフォワード3D編集における中心的な課題は、高品質なペア管理の欠如にある。
編集可能な3Dアセットは、幾何の同時保存、複数ビューの一貫性、構造的コヒーレンス、局所的な編集制御性を必要とする。
既存の3D編集データセットは、しばしば独立して生成された資産、画像による再構成、あるいは狭い編集分類に依存し、不正確なローカライゼーション、弱い保存、ぼやけた編集境界、限定的な意味的一貫性をもたらす。
スケーラブルなフィードフォワード3D編集はセマンティック部分変換から学習されるべきである。
そこで本研究では,Pxformを提案する。Pxformは高品質な3D編集データセットである。
オブジェクトを非構造化形状として扱う代わりに、パイプライングラウンドはセマンティックな3Dパーツで直接編集します。
さらに,Pxformをベースとしたフィードフォワード3D編集ネットワークPartFlowを提案する。
PartFlowは、マスク対応の速度保存とレンダリング空間の整合性管理を導入し、推論中に3D編集マスクを必要とせず、編集忠実度とソース保存を共同で改善する。
高度な実験により、高品質なセマンティック・パーツの監視がスケーラブルな3D編集を大幅に改善し、PartFlowが幾何的および外観の編集ベンチマークで最先端のパフォーマンスを達成できることが示されている。
関連論文リスト
- VGGT-Edit: Feed-forward Native 3D Scene Editing with Residual Field Prediction [59.303842406260124]
VGGT-Editはテキスト条件のネイティブ3Dシーン編集のためのフィードフォワードフレームワークである。
本研究では,奥行き同期テキストインジェクションを導入し,意味的指導をバックボーンの空間的ポーズと整合させる。
VGGT-Editは2Dリフトベースラインを大幅に上回り、よりシャープなオブジェクトの詳細、より強力なマルチビュー一貫性、ほぼインスタントな推論速度を生み出している。
論文 参考訳(メタデータ) (2026-05-14T17:59:04Z) - Easy3E: Feed-Forward 3D Asset Editing via Rectified Voxel Flow [29.8200628539749]
TRELLIS生成バックボーンに基づく,効果的かつ完全なフィードフォワード3D編集フレームワークを提案する。
本フレームワークは,3次元表現に自由な2次元編集を適用すること,圧縮された3次元特徴の外観忠実性のボトルネックを克服すること,の2つの主要な課題に対処する。
論文 参考訳(メタデータ) (2026-02-25T02:15:14Z) - Vinedresser3D: Agentic Text-guided 3D Editing [26.81659566314386]
Vinedresser3Dは高品質なテキスト誘導3D編集のためのエージェントフレームワークである。
ネイティブな3D生成モデルの潜在空間で直接動作する。
多様な3D編集の実験では、Vinedresser3Dは自動メトリクスと人間の嗜好の両方において、以前のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2026-02-23T06:30:36Z) - NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks [29.825760228576744]
Nano3Dは、マスクなしで正確でコヒーレントな3Dオブジェクト編集のためのトレーニング不要のフレームワークである。
我々は,10万以上の高品質な3D編集ペアを含む,最初の大規模3D編集データセットであるNano3D-Edit-100kを構築した。
論文 参考訳(メタデータ) (2025-10-16T17:51:50Z) - Towards Scalable and Consistent 3D Editing [32.16698854719098]
3D編集は没入型コンテンツ制作、デジタルエンターテイメント、AR/VRに広く応用されている。
2D編集とは異なり、クロスビューの一貫性、構造的忠実さ、きめ細かい制御性を必要とするため、依然として困難である。
我々はこれまでで最大の3D編集ベンチマークである3DEditVerseを紹介した。
モデル側では、3次元構造保存条件変換器である3DEditFormerを提案する。
論文 参考訳(メタデータ) (2025-10-03T13:34:55Z) - PrEditor3D: Fast and Precise 3D Shape Editing [100.09112677669376]
本稿では,1つの形状の編集を数分以内に行うことができる3D編集のためのトレーニングフリーアプローチを提案する。
編集された3Dメッシュはプロンプトとよく一致しており、変更を意図していない領域でも同じである。
論文 参考訳(メタデータ) (2024-12-09T15:44:47Z) - View-Consistent 3D Editing with Gaussian Splatting [50.6460814430094]
View-Consistent Editing (VcEdit)は、3DGSをシームレスに画像編集プロセスに組み込む新しいフレームワークである。
一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文 参考訳(メタデータ) (2024-03-18T15:22:09Z) - Plasticine3D: 3D Non-Rigid Editing with Text Guidance by Multi-View Embedding Optimization [21.8454418337306]
本研究では,3次元非剛性編集が可能なテキスト誘導型3D編集パイプラインであるPlastine3Dを提案する。
本研究は,編集過程を幾何学的編集段階とテクスチャ的編集段階に分割し,構造と外観を別々に制御する。
細粒度制御のために,埋め込み空間の編集目的と原特徴を融合させるエンベディング・フュージョン (EF) を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:01:54Z) - SHAP-EDITOR: Instruction-guided Latent 3D Editing in Seconds [73.91114735118298]
Shap-Editorは、新しいフィードフォワード3D編集フレームワークである。
フィードフォワード・エディター・ネットワークを構築することで,この空間で直接3D編集を行うことが可能であることを示す。
論文 参考訳(メタデータ) (2023-12-14T18:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。