論文の概要: EditSSC: Toward Editable Semantic Occupancy Scenes with Unconditional Diffusion Models
- arxiv url: http://arxiv.org/abs/2606.09273v1
- Date: Mon, 08 Jun 2026 09:41:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.905415
- Title: EditSSC: Toward Editable Semantic Occupancy Scenes with Unconditional Diffusion Models
- Title(参考訳): EditSSC:非条件拡散モデルによる編集可能なセマンティックアクシデントシーンを目指して
- Authors: Fatima Balde, Raoul de Charette, Alexandre Boulch,
- Abstract要約: 本稿では,3Dセマンティックシーン生成のための編集対応手法であるEditSSCを提案する。
提案手法は, セマンティック占有網を多チャンネルBEV画像に置き換える。
コードブックのクラス間対応を利用することで、スケッチ誘導生成、インペイント、アウトペイントをサポートでき、再学習は不要である。
- 参考スコア(独自算出の注目度): 58.566303405645726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D semantic scene generation is crucial for autonomous driving applications, yet most methods rely on complex 3D-specific architectures such as triplane encoders and adapted diffusion networks, limiting both their simplicity and their editing capabilities. We propose EditSSC, an editing-ready method for 3D semantic scene generation using 2D Bird's Eye View (BEV) representations and off-the-shelf latent diffusion network. Our approach reshapes 3D semantic occupancy grids into multi-channel BEV images and leverages the quantized autoencoder and UNet from Stable Diffusion with minimal modifications. We perform diffusion on the latents after quantization, which enables training-free editing capabilities. By exploiting class-to-code correspondences in the codebook, our method supports sketch-guided generation, inpainting, and outpainting without any retraining. On SemanticKITTI, EditSSC outperforms existing 3D-specific baselines on unconditional generation, demonstrating that well-established 2D architectures can be effectively repurposed for 3D scene generation and editing.
- Abstract(参考訳): 3Dセマンティックシーン生成は自律運転アプリケーションには不可欠であるが、ほとんどの手法はトリプレーンエンコーダや適応拡散ネットワークのような複雑な3D固有のアーキテクチャに依存しており、単純さと編集能力の両方を制限している。
本研究では,2D Bird's Eye View (BEV) 表現とオフザシェルフ潜伏拡散ネットワークを用いた3Dセマンティックシーン生成のための編集対応手法であるEditSSCを提案する。
提案手法は,3次元セマンティック占有格子をマルチチャネルのBEV画像に再結合し,最小限の修正を施したスタブルディフュージョンの量子化オートエンコーダとUNetを利用する。
我々は、量子化後の潜伏者に対して拡散を行い、トレーニング不要な編集機能を実現する。
コードブックのクラス間対応を利用することで、スケッチ誘導生成、インペイント、アウトペイントをサポートでき、再学習は不要である。
SemanticKITTIでは、EditSSCが既存の3D固有のベースラインを非条件生成で上回り、確立された2Dアーキテクチャが3Dシーンの生成と編集に効果的に再利用できることを実証している。
関連論文リスト
- Easy3E: Feed-Forward 3D Asset Editing via Rectified Voxel Flow [29.8200628539749]
TRELLIS生成バックボーンに基づく,効果的かつ完全なフィードフォワード3D編集フレームワークを提案する。
本フレームワークは,3次元表現に自由な2次元編集を適用すること,圧縮された3次元特徴の外観忠実性のボトルネックを克服すること,の2つの主要な課題に対処する。
論文 参考訳(メタデータ) (2026-02-25T02:15:14Z) - ShapeUP: Scalable Image-Conditioned 3D Editing [44.63222737714384]
ShapeUPはスケーラブルでイメージコンディショニングされた3D編集フレームワークである。
ネイティブな3D表現の中で、教師付きラテントからラテントへの翻訳として編集を定式化する。
評価の結果,ShapeUPはアイデンティティの保存と編集の両面で,現在のトレーニングやトレーニング不要のベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-02-05T13:59:16Z) - 3D-LATTE: Latent Space 3D Editing from Textual Instructions [64.77718887666312]
本研究では,ネイティブな3次元拡散モデルの潜在空間内で動作する学習自由な編集手法を提案する。
生成元からの3Dアテンションマップとソースオブジェクトをブレンドすることで、編集合成をガイドする。
論文 参考訳(メタデータ) (2025-08-29T22:51:59Z) - SceneFactor: Factored Latent 3D Diffusion for Controllable 3D Scene Generation [44.354071773885735]
SceneFactorは、大規模な3Dシーン生成のための拡散ベースのアプローチである。
制御可能な生成と手間のかかる編集を可能にする。
提案手法は,効率的な編集が可能な高忠実度3次元シーン合成を実現する。
論文 参考訳(メタデータ) (2024-12-02T18:47:41Z) - 3DEgo: 3D Editing on the Go! [6.072473323242202]
本稿では,テキストプロンプトで案内されたモノクロ映像から3Dシーンを直接合成する新しい問題に対処する3DEgoを紹介する。
本フレームワークは,従来のマルチステージ3D編集プロセスを一段階のワークフローに合理化する。
3DEgoは、様々なビデオソースの編集精度、速度、適応性を示す。
論文 参考訳(メタデータ) (2024-07-14T07:03:50Z) - Chat-Edit-3D: Interactive 3D Scene Editing via Text Prompts [76.73043724587679]
CE3Dと呼ばれる対話型3Dシーン編集手法を提案する。
Hash-Atlasは3Dシーンビューを表し、3Dシーンの編集を2Dアトラスイメージに転送する。
その結果、CE3Dは複数の視覚モデルを効果的に統合し、多様な視覚効果が得られることを示した。
論文 参考訳(メタデータ) (2024-07-09T13:24:42Z) - Coin3D: Controllable and Interactive 3D Assets Generation with Proxy-Guided Conditioning [52.81032340916171]
Coin3Dを使えば、ユーザーは基本的な形状から組み立てられた粗い幾何学的プロキシを使って3D生成を制御できる。
本手法は,3次元アセット生成タスクにおいて,制御性と柔軟性に優れる。
論文 参考訳(メタデータ) (2024-05-13T17:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。