論文の概要: TransSplat: Unbalanced Semantic Transport for Language-Driven 3DGS Editing
- arxiv url: http://arxiv.org/abs/2604.19571v2
- Date: Thu, 30 Apr 2026 03:32:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 14:06:12.531173
- Title: TransSplat: Unbalanced Semantic Transport for Language-Driven 3DGS Editing
- Title(参考訳): TransSplat: 言語駆動3DGS編集のための非バランスなセマンティックトランスポート
- Authors: Yanhui Chen, Jiahong Li, Jingchao Wang, Junyi Lin, Zixin Zeng, Yang Shi,
- Abstract要約: 言語駆動型3DGS編集を多視点アンバランスなセマンティックトランスポート問題として定式化するTransSplatを提案する。
具体的には、可視ガウスとビュー固有の編集プロトタイプとの対応性を確立する。
さらに、クロスビュー共有の標準3D編集フィールドを復元し、統一された3D外観更新をガイドする。
- 参考スコア(独自算出の注目度): 9.002007453825486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Language-driven 3D Gaussian Splatting (3DGS) editing provides a more convenient approach for modifying complex scenes in VR/AR. Standard pipelines typically adopt a two-stage strategy: first editing multiple 2D views, and then optimizing the 3D representation to match these edited observations. Existing methods mainly improve view consistency through multi-view feature fusion, attention filtering, or iterative recalibration. However, they fail to explicitly address a more fundamental issue: the semantic correspondence between edited 2D evidence and 3D Gaussians. To tackle this problem, we propose TransSplat, which formulates language-driven 3DGS editing as a multi-view unbalanced semantic transport problem. Specifically, our method establishes correspondences between visible Gaussians and view-specific editing prototypes, thereby explicitly characterizing the semantic relationship between edited 2D evidence and 3D Gaussians. It further recovers a cross-view shared canonical 3D edit field to guide unified 3D appearance updates. In addition, we use transport residuals to suppress erroneous edits in non-target regions, mitigating edit leakage and improving local control precision. Qualitative and quantitative results show that, compared with existing 3D editing methods centered on enhancing view consistency, TransSplat achieves superior performance in local editing accuracy and structural consistency.
- Abstract(参考訳): 言語駆動の3Dガウススプラッティング(3DGS)編集は、VR/ARの複雑なシーンを修正するためのより便利なアプローチを提供する。
標準的なパイプラインでは、まず複数の2Dビューを編集し、次に3D表現を最適化して、これらの編集された観察にマッチさせるという、2段階の戦略が採用されている。
既存の方法は、主にマルチビュー特徴融合、アテンションフィルタリング、反復的再校正によってビューの一貫性を改善する。
しかし、彼らは、編集された2D証拠と3Dガウスのセマンティックな対応という、より根本的な問題に明示的に対処することができない。
この問題に対処するために,多視点非バランスなセマンティックトランスポート問題として言語駆動型3DGS編集を定式化するTransSplatを提案する。
具体的には、視覚的なガウスとビュー固有の編集プロトタイプの対応性を確立し、編集された2Dエビデンスと3Dガウスのセマンティックな関係を明確に特徴付ける。
さらに、クロスビュー共有の標準3D編集フィールドを復元し、統一された3D外観更新をガイドする。
さらに,非ターゲット領域における誤編集の抑制,編集リークの軽減,局所制御精度の向上にトランスポート残差を用いる。
定性的かつ定量的な結果は、ビュー整合性向上を中心とした既存の3D編集方法と比較して、TransSplatは局所的な編集精度と構造整合性において優れた性能を達成していることを示している。
関連論文リスト
- InterGSEdit: Interactive 3D Gaussian Splatting Editing with 3D Geometry-Consistent Attention Prior [3.6657066043195585]
InterGSEditは、ユーザの好みでキービューをインタラクティブに選択することで、高品質な3DGS編集のための新しいフレームワークである。
我々は,意図融合ネットワーク(AFN)を介して2次元交差注意と融合した3次元制約された注意を得るために,GAP3D$を計画する。
論文 参考訳(メタデータ) (2025-07-07T13:04:26Z) - TIGER: Text-Instructed 3D Gaussian Retrieval and Coherent Editing [12.50147114409895]
本稿では,テキストによる3Dガウス検索と編集のための体系的アプローチ,すなわちTIGERを提案する。
本稿では,2次元画像編集拡散モデルと多視点拡散モデルを集約したコヒーレントスコア蒸留(CSD)を提案する。
論文 参考訳(メタデータ) (2024-05-23T11:37:17Z) - DGE: Direct Gaussian 3D Editing by Consistent Multi-view Editing [72.54566271694654]
オープンな言語命令に基づいて3Dオブジェクトやシーンを編集する際の問題点を考察する。
この問題に対する一般的なアプローチは、3D編集プロセスをガイドするために2Dイメージジェネレータまたはエディタを使用することである。
このプロセスは、コストのかかる3D表現の反復的な更新を必要とするため、しばしば非効率である。
論文 参考訳(メタデータ) (2024-04-29T17:59:30Z) - View-Consistent 3D Editing with Gaussian Splatting [50.6460814430094]
View-Consistent Editing (VcEdit)は、3DGSをシームレスに画像編集プロセスに組み込む新しいフレームワークである。
一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文 参考訳(メタデータ) (2024-03-18T15:22:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。