論文の概要: SplatPainter: Interactive Authoring of 3D Gaussians from 2D Edits via Test-Time Training
- arxiv url: http://arxiv.org/abs/2512.05354v1
- Date: Fri, 05 Dec 2025 01:42:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:56.859786
- Title: SplatPainter: Interactive Authoring of 3D Gaussians from 2D Edits via Test-Time Training
- Title(参考訳): SplatPainter: テストタイムトレーニングによる2D編集からの3Dガウスのインタラクティブオーサリング
- Authors: Yang Zheng, Hao Tan, Kai Zhang, Peng Wang, Leonidas Guibas, Gordon Wetzstein, Wang Yifan,
- Abstract要約: ユーザが提供する2Dビューから3次元ガウス資産の連続的な編集を可能にする状態認識フィードフォワードモデルである ourmethod を導入する。
提案手法は,コンパクトで機能豊富なガウス表現の属性の更新を直接予測し,テスト時間トレーニングを利用して状態認識の反復的ワークフローを作成する。
このアプローチの汎用性により、高忠実なローカルディテールリファインメント、ローカルペンキオーバー、一貫したグローバルリカラー化など、対話的な速度で、単一のアーキテクチャでさまざまなタスクを実行できる。
- 参考スコア(独自算出の注目度): 40.609684377021146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of 3D Gaussian Splatting has revolutionized photorealistic 3D asset creation, yet a critical gap remains for their interactive refinement and editing. Existing approaches based on diffusion or optimization are ill-suited for this task, as they are often prohibitively slow, destructive to the original asset's identity, or lack the precision for fine-grained control. To address this, we introduce \ourmethod, a state-aware feedforward model that enables continuous editing of 3D Gaussian assets from user-provided 2D view(s). Our method directly predicts updates to the attributes of a compact, feature-rich Gaussian representation and leverages Test-Time Training to create a state-aware, iterative workflow. The versatility of our approach allows a single architecture to perform diverse tasks, including high-fidelity local detail refinement, local paint-over, and consistent global recoloring, all at interactive speeds, paving the way for fluid and intuitive 3D content authoring.
- Abstract(参考訳): 3Dガウシアン・スプラッティングの台頭は、フォトリアリスティックな3Dアセットの創造に革命をもたらしたが、インタラクティブな洗練と編集のために重要なギャップが残っている。
拡散や最適化に基づく既存のアプローチは、しばしば故意に遅く、元の資産のアイデンティティに破壊的であり、きめ細かい制御の精度を欠いているため、このタスクには不適である。
これを解決するために,ユーザが提供する2次元ビューから3次元ガウス資産の連続的な編集を可能にする状態認識フィードフォワードモデルである \ourmethod を導入する。
提案手法は,コンパクトで機能豊富なガウス表現の属性の更新を直接予測し,テスト時間トレーニングを利用して状態認識の反復的ワークフローを作成する。
このアプローチの汎用性により、高忠実度ローカルディテールの精細化、局所ペイントオーバー、一貫したグローバルリカラー化などの多様なタスクを、インタラクティブなスピードで実行し、流動的で直感的な3Dコンテンツオーサリングの道を開くことができる。
関連論文リスト
- GaussianBlender: Instant Stylization of 3D Gaussians with Disentangled Latent Spaces [26.8406399975604]
3Dスタイリングはゲーム開発、仮想現実、デジタルアートの中心である。
既存の2次元画像エディターからのテキスト・ツー・3Dスタイリング手法
我々はテキスト駆動型3Dスタイリングのための先駆的なフィードフォワードフレームワークを導入し、推論時に即座に編集を行う。
論文 参考訳(メタデータ) (2025-12-03T11:23:07Z) - R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation [78.26308457952636]
本稿では,自律運転シミュレーションの限界を克服する軽量な1ステップ拡散モデルであるR3D2を紹介する。
シャドウや一貫した照明など、妥当なレンダリング効果を生み出すことで、既存のシーンに完全な3Dアセットを現実的に挿入することができる。
R3D2は挿入されたアセットの現実性を大幅に向上させ,テキストから3Dへのアセット挿入やクロスシーン/データセットオブジェクト転送といったユースケースを可能にした。
論文 参考訳(メタデータ) (2025-06-09T14:50:19Z) - VoxelSplat: Dynamic Gaussian Splatting as an Effective Loss for Occupancy and Flow Prediction [46.31516096522758]
カメラによる占領予測の最近の進歩は、3Dセマンティクスとシーンフローの同時予測に焦点を当てている。
本稿では,これらの課題とその根本原因を解決するために,VoxelSplatという新たな正規化フレームワークを提案する。
本フレームワークは,ガウス運動をモデル化するために,予測されたシーンフローを用いて,移動物体のシーンフローを自己監督的に学習することができる。
論文 参考訳(メタデータ) (2025-06-05T20:19:35Z) - EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.1662426227688]
既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文 参考訳(メタデータ) (2025-03-26T02:47:27Z) - 3DSceneEditor: Controllable 3D Scene Editing with Gaussian Splatting [31.98493679748211]
ガウススプラッティングを用いた3次元シーンのリアルタイムかつ高精度な編集を行う3DceneEditorを提案する。
従来の方法とは異なり、3DSceneEditorは3Dパイプラインを通して動作し、効率よく高品質な編集のためにガウシアンを直接操作できる。
論文 参考訳(メタデータ) (2024-12-02T15:03:55Z) - DragGaussian: Enabling Drag-style Manipulation on 3D Gaussian Representation [57.406031264184584]
DragGaussianは、3D Gaussian Splattingをベースにした3Dオブジェクトのドラッグ編集フレームワークである。
我々の貢献は、新しいタスクの導入、インタラクティブなポイントベース3D編集のためのDragGaussianの開発、質的かつ定量的な実験によるその効果の包括的検証などである。
論文 参考訳(メタデータ) (2024-05-09T14:34:05Z) - DGE: Direct Gaussian 3D Editing by Consistent Multi-view Editing [72.54566271694654]
オープンな言語命令に基づいて3Dオブジェクトやシーンを編集する際の問題点を考察する。
この問題に対する一般的なアプローチは、3D編集プロセスをガイドするために2Dイメージジェネレータまたはエディタを使用することである。
このプロセスは、コストのかかる3D表現の反復的な更新を必要とするため、しばしば非効率である。
論文 参考訳(メタデータ) (2024-04-29T17:59:30Z) - latentSplat: Autoencoding Variational Gaussians for Fast Generalizable 3D Reconstruction [48.86083272054711]
latentSplatは3D潜在空間における意味ガウスを予測し、軽量な生成型2Dアーキテクチャで切り落としてデコードする手法である。
latentSplatは、高速でスケーラブルで高解像度なデータでありながら、復元品質と一般化におけるこれまでの成果よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-24T20:48:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。