Fugu-MT 論文翻訳(概要): ICE-G: Image Conditional Editing of 3D Gaussian Splats

論文の概要: ICE-G: Image Conditional Editing of 3D Gaussian Splats

arxiv url: http://arxiv.org/abs/2406.08488v1
Date: Wed, 12 Jun 2024 17:59:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-13 15:27:35.090420
Title: ICE-G: Image Conditional Editing of 3D Gaussian Splats
Title（参考訳）: ICE-G:3次元ガウスプレートの画像条件編集
Authors: Vishnu Jaganathan, Hannah Hanyun Huang, Muhammad Zubair Irshad, Varun Jampani, Amit Raj, Zsolt Kira,
Abstract要約: 単一の参照ビューから3Dモデルを素早く編集するための新しいアプローチを提案する。我々の技術はまず編集画像を分割し、選択したセグメント化されたデータセットビュー間で意味的に対応する領域をマッチングする。編集画像の特定の領域からの色やテクスチャの変化を、意味的に理解できる方法で、他のビューに自動的に適用することができる。
参考スコア（独自算出の注目度）: 45.112689255145625
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently many techniques have emerged to create high quality 3D assets and scenes. When it comes to editing of these objects, however, existing approaches are either slow, compromise on quality, or do not provide enough customization. We introduce a novel approach to quickly edit a 3D model from a single reference view. Our technique first segments the edit image, and then matches semantically corresponding regions across chosen segmented dataset views using DINO features. A color or texture change from a particular region of the edit image can then be applied to other views automatically in a semantically sensible manner. These edited views act as an updated dataset to further train and re-style the 3D scene. The end-result is therefore an edited 3D model. Our framework enables a wide variety of editing tasks such as manual local edits, correspondence based style transfer from any example image, and a combination of different styles from multiple example images. We use Gaussian Splats as our primary 3D representation due to their speed and ease of local editing, but our technique works for other methods such as NeRFs as well. We show through multiple examples that our method produces higher quality results while offering fine-grained control of editing. Project page: ice-gaussian.github.io
Abstract（参考訳）: 近年,高品質な3Dアセットやシーンを作る技術が数多く出現している。しかしながら、これらのオブジェクトの編集に関しては、既存のアプローチは遅いか、品質を損なうか、あるいは十分なカスタマイズを提供していないかのどちらかです。単一の参照ビューから3Dモデルを素早く編集するための新しいアプローチを提案する。我々の技術はまず編集画像を分割し、次にDINO機能を用いて選択したセグメント化されたデータセットビュー間で意味的に対応する領域をマッチングする。編集画像の特定の領域からの色やテクスチャの変化を、意味的に理解できる方法で、他のビューに自動的に適用することができる。これらの編集されたビューは、3Dシーンをさらにトレーニングし、再フォーマットするための更新データセットとして機能する。したがって、終末は編集された3Dモデルである。本フレームワークは,手動のローカル編集,任意の例画像からの対応ベースのスタイル転送,複数例画像からの異なるスタイルの組み合わせなど,多種多様な編集作業を可能にする。局所編集のスピードと容易さから,我々はガウススプラッターを主要な3次元表現として用いているが,この手法はNeRFなどの他の手法でも有効である。提案手法は,編集のきめ細かい制御を行いながら,高品質な結果が得られることを示す。プロジェクトページ: ice-gaussian.github.io

関連論文リスト

NeRF-Insert: 3D Local Editing with Multimodal Control Signals [97.91172669905578]
NeRF-InsertはNeRF編集フレームワークで、ユーザーは柔軟なレベルのコントロールで高品質なローカル編集ができる。我々は,シーン編集を塗装上の問題として捉え,シーンのグローバルな構造を保たせるようにした。以上の結果から,視覚的品質が向上し,元のNeRFとの整合性も向上した。
論文参考訳（メタデータ） (2024-04-30T02:04:49Z)
View-Consistent 3D Editing with Gaussian Splatting [50.6460814430094]
View-Consistent Editing (VcEdit)は、3DGSをシームレスに画像編集プロセスに組み込む新しいフレームワークである。一貫性モジュールを反復パターンに組み込むことで、VcEditはマルチビューの不整合の問題を十分に解決する。
論文参考訳（メタデータ） (2024-03-18T15:22:09Z)
GaussCtrl: Multi-View Consistent Text-Driven 3D Gaussian Splatting Editing [38.948892064761914]
GaussCtrlは、3D Gaussian Splatting(3DGS)によって再構成された3Dシーンを編集するテキスト駆動方式である。私たちの重要な貢献は、複数ビューの一貫性のある編集であり、1つの画像を反復的に編集する代わりに、すべての画像を一緒に編集できる。
論文参考訳（メタデータ） (2024-03-13T17:35:28Z)
Real-time 3D-aware Portrait Editing from a Single Image [111.27169315556444]
3DPEは、参照画像やテキスト記述など、与えられたプロンプトに従って顔画像を編集することができる。軽量モジュールは、3Dポートレートジェネレータとテキスト・ツー・イメージ・モデルから蒸留される。
論文参考訳（メタデータ） (2024-02-21T18:36:26Z)
Free-Editor: Zero-shot Text-driven 3D Scene Editing [8.966537479017951]
大規模なデータセットが不足しているため、3次元シーン編集に特化した拡散モデルを訓練することは困難である。モデル再学習を必要とせずに3Dシーンを編集できる「textscFree-Editor」という新しい3Dシーン編集技術を紹介した。本手法は,SOTA(State-of-the-art)手法におけるマルチビュースタイルの不整合の問題を効果的に解決する。
論文参考訳（メタデータ） (2023-12-21T08:40:57Z)
Learning Naturally Aggregated Appearance for Efficient 3D Editing [90.57414218888536]
カラーフィールドは、標準画像(canonical image)とも呼ばれる、明示的な2次元の外観アグリゲーションとして学習する。テクスチャクエリのために3Dポイントを2Dピクセルにマッピングする投影場を標準画像に補完する。提案手法は,既存のNeRFベースの編集手法に比べて,編集1回あたり20倍高速であることを示す。
論文参考訳（メタデータ） (2023-12-11T18:59:31Z)
Editing 3D Scenes via Text Prompts without Retraining [80.57814031701744]
DN2Nはテキスト駆動編集方式であり、普遍的な編集機能を備えたNeRFモデルの直接取得を可能にする。本手法では,2次元画像のテキストベース編集モデルを用いて3次元シーン画像の編集を行う。本手法は,外観編集,天気変化,材質変化,スタイル伝達など,複数種類の編集を行う。
論文参考訳（メタデータ） (2023-09-10T02:31:50Z)
SINE: Semantic-driven Image-based NeRF Editing with Prior-guided Editing Field [37.8162035179377]
我々は,1つの画像でニューラルラディアンスフィールドを編集できる,新しい意味駆動型NeRF編集手法を提案する。この目的を達成するために,3次元空間における微細な幾何学的・テクスチャ的編集を符号化する事前誘導編集場を提案する。本手法は,1枚の編集画像のみを用いた写真リアルな3D編集を実現し,実世界の3Dシーンにおけるセマンティックな編集の限界を押し上げる。
論文参考訳（メタデータ） (2023-03-23T13:58:11Z)
EditGAN: High-Precision Semantic Image Editing [120.49401527771067]
EditGANは高品質で高精度なセマンティック画像編集のための新しい手法である。 EditGANは前例のない細部と自由度で画像を操作可能であることを示す。また、複数の編集を組み合わせることも簡単で、EditGANのトレーニングデータ以外の編集も可能になります。
論文参考訳（メタデータ） (2021-11-04T22:36:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。