論文の概要: GeM-NR: Geometry-Aware Multi-View Editing for Nonrigid Scene Changes
- arxiv url: http://arxiv.org/abs/2606.05142v1
- Date: Wed, 03 Jun 2026 17:49:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.939443
- Title: GeM-NR: Geometry-Aware Multi-View Editing for Nonrigid Scene Changes
- Title(参考訳): GeM-NR:非厳密なシーン変化のための幾何学的マルチビュー編集
- Authors: Josef Bengtson, Yaroslava Lochman, Fredrik Kahl,
- Abstract要約: 一般的なマルチビュー一貫した画像編集のためのトレーニング不要なアプローチであるGeM-NRを提案する。
アンカー画像とクエリ未編集画像が与えられた場合、GeM-NRはアンカー編集と一貫してクエリ画像を編集する。
本手法は,編集シーンの3次元表現生成を含む,多種多様な編集タスクの一貫性を向上させる。
- 参考スコア(独自算出の注目度): 18.344326720479824
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent developments in multi-view image editing with generative models have brought us a step closer toward general 3D content generation and customization. Most existing works focus on rigid or appearance-only edits by utilizing the geometry of the unedited scene. This naturally limits these methods to edits that preserve the underlying scene structure. Other approaches are trained for specific image editing tasks, such as object removal and addition. Despite this progress, general nonrigid edits, i.e., edits that substantially change the scene geometry, remain challenging for existing methods. We propose GeM-NR, a fast and flexible training-free approach for general multi-view consistent image editing, including edits that drastically change the geometry and appearance of the scene. Given an anchor image edited with a chosen backbone editor (such as FLUX, Qwen, BrushNet) and a query unedited image, GeM-NR edits the query image consistently with the anchor edit. The method incorporates multiple stages: (i) depth map estimation, where we propose a strategy to maximize the alignment between the 3D point clouds of the edited and unedited scenes, (ii) projection onto a query viewpoint, and (iii) refinement of the obtained image conditioned on the unedited query. The conditioning-based formulation scales well from two to many views of an object. We demonstrate the ability of our method to handle edits with significant changes in geometry and appearance, something that existing methods struggle with. We perform an extensive evaluation showing that our method improves consistency for a wide variety of edit tasks, including generating 3D representations of the edited scene. Both quantitative and qualitative results indicate the state-of-the-art performance of our method in terms of edit quality as well as geometric and photometric consistency across multiple views.
- Abstract(参考訳): 生成モデルを用いた多視点画像編集の最近の進歩は、一般的な3Dコンテンツ生成とカスタマイズに向けて一歩近づいた。
現存する作品の多くは、未編集のシーンの幾何学を利用して、厳密または外観のみの編集に焦点を当てている。
これにより、これらのメソッドは、下層のシーン構造を保存する編集に制限される。
他のアプローチは、オブジェクトの削除や追加など、特定の画像編集タスクのために訓練されている。
この進歩にもかかわらず、一般的な非厳密な編集、すなわちシーンの幾何学を著しく変える編集は、既存の方法では難しいままである。
本稿では,多視点一貫した画像編集のための高速でフレキシブルなトレーニングフリーアプローチであるGeM-NRを提案する。
選択したバックボーンエディタ(FLUX, Qwen, BrushNetなど)で編集されたアンカーイメージとクエリ未編集のイメージが与えられた場合、GeM-NRはアンカー編集で一貫してクエリ画像を編集する。
方法は複数の段階を含む。
(i)深度マップ推定では,編集されたシーンと未編集シーンの3次元点雲のアライメントを最大化するための戦略を提案する。
(ii)クエリ視点へのプロジェクション、および
(iii)未編集のクエリで条件付けされた画像の精細化。
条件付けに基づく定式化は、オブジェクトの2つのビューから多くのビューにうまくスケールする。
我々は,既存の手法が抱える幾何や外観に大きな変化を伴って編集を処理できることを実証する。
本手法は,編集シーンの3次元表現生成を含む多種多様な編集タスクの整合性を向上することを示す広範囲な評価を行う。
定量的および定性的な結果は、編集品質および幾何的および測光的整合性の観点から、我々の手法の最先端性能を示している。
関連論文リスト
- ICE-G: Image Conditional Editing of 3D Gaussian Splats [45.112689255145625]
単一の参照ビューから3Dモデルを素早く編集するための新しいアプローチを提案する。
我々の技術はまず編集画像を分割し、選択したセグメント化されたデータセットビュー間で意味的に対応する領域をマッチングする。
編集画像の特定の領域からの色やテクスチャの変化を、意味的に理解できる方法で、他のビューに自動的に適用することができる。
論文 参考訳(メタデータ) (2024-06-12T17:59:52Z) - Plasticine3D: 3D Non-Rigid Editing with Text Guidance by Multi-View Embedding Optimization [21.8454418337306]
本研究では,3次元非剛性編集が可能なテキスト誘導型3D編集パイプラインであるPlastine3Dを提案する。
本研究は,編集過程を幾何学的編集段階とテクスチャ的編集段階に分割し,構造と外観を別々に制御する。
細粒度制御のために,埋め込み空間の編集目的と原特徴を融合させるエンベディング・フュージョン (EF) を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:01:54Z) - Customize your NeRF: Adaptive Source Driven 3D Scene Editing via
Local-Global Iterative Training [61.984277261016146]
テキスト記述や参照画像を編集プロンプトとして統合するCustomNeRFモデルを提案する。
最初の課題に取り組むために,前景領域編集とフルイメージ編集を交互に行うローカル・グローバル反復編集(LGIE)トレーニング手法を提案する。
第2の課題として、生成モデル内のクラス事前を利用して、一貫性の問題を緩和するクラス誘導正規化を設計する。
論文 参考訳(メタデータ) (2023-12-04T06:25:06Z) - Optimisation-Based Multi-Modal Semantic Image Editing [58.496064583110694]
本稿では,複数の編集命令型に対応するために,推論時編集の最適化を提案する。
各損失関数の影響を調整することで、ユーザの好みに合わせてフレキシブルな編集ソリューションを構築することができる。
本手法は,テキスト,ポーズ,スクリブルといった編集条件を用いて評価し,複雑な編集を行う能力を強調した。
論文 参考訳(メタデータ) (2023-11-28T15:31:11Z) - Object-aware Inversion and Reassembly for Image Editing [61.19822563737121]
オブジェクトレベルのきめ細かい編集を可能にするために,オブジェクト認識型インバージョンと再アセンブリ(OIR)を提案する。
画像の編集時に各編集ペアに対して最適な反転ステップを見つけるために,検索基準を用いる。
本手法は,オブジェクトの形状,色,材料,カテゴリなどの編集において,特に多目的編集シナリオにおいて優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-10-18T17:59:02Z) - Editing 3D Scenes via Text Prompts without Retraining [80.57814031701744]
DN2Nはテキスト駆動編集方式であり、普遍的な編集機能を備えたNeRFモデルの直接取得を可能にする。
本手法では,2次元画像のテキストベース編集モデルを用いて3次元シーン画像の編集を行う。
本手法は,外観編集,天気変化,材質変化,スタイル伝達など,複数種類の編集を行う。
論文 参考訳(メタデータ) (2023-09-10T02:31:50Z) - SINE: Semantic-driven Image-based NeRF Editing with Prior-guided Editing
Field [37.8162035179377]
我々は,1つの画像でニューラルラディアンスフィールドを編集できる,新しい意味駆動型NeRF編集手法を提案する。
この目的を達成するために,3次元空間における微細な幾何学的・テクスチャ的編集を符号化する事前誘導編集場を提案する。
本手法は,1枚の編集画像のみを用いた写真リアルな3D編集を実現し,実世界の3Dシーンにおけるセマンティックな編集の限界を押し上げる。
論文 参考訳(メタデータ) (2023-03-23T13:58:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。