論文の概要: Beyond Prompts: Unconditional 3D Inversion for Out-of-Distribution Shapes
- arxiv url: http://arxiv.org/abs/2604.14914v1
- Date: Thu, 16 Apr 2026 11:55:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.879941
- Title: Beyond Prompts: Unconditional 3D Inversion for Out-of-Distribution Shapes
- Title(参考訳): プロンプトを超えて:アウト・オブ・ディストリビューション・シェイプのための無条件3Dインバージョン
- Authors: Victoria Yue Chen, Emery Pierson, Léopold Maillard, Maks Ovsjanikov,
- Abstract要約: 我々は、最先端のネイティブテキストから3D生成モデルにおいて、この仮定はしばしば崩壊することを示した。
潜水トラップに世代軌道を描画する臨界故障モードを同定する。」
これらの規則では、入力テキストの変更は出力幾何学を変更する方法で内部表現を変更することに失敗する。
提案手法は,現在の3次元パイプラインの限界に対処し,分布外3次元形状の高忠実な意味操作を可能にする。
- 参考スコア(独自算出の注目度): 29.504851826197996
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Text-driven inversion of generative models is a core paradigm for manipulating 2D or 3D content, unlocking numerous applications such as text-based editing, style transfer, or inverse problems. However, it relies on the assumption that generative models remain sensitive to natural language prompts. We demonstrate that for state-of-the-art native text-to-3D generative models, this assumption often collapses. We identify a critical failure mode where generation trajectories are drawn into latent ``sink traps'': regions where the model becomes insensitive to prompt modifications. In these regimes, changes to the input text fail to alter internal representations in a way that alters the output geometry. Crucially, we observe that this is not a limitation of the model's \textit{geometric} expressivity; the same generative models possess the ability to produce a vast diversity of shapes but, as we demonstrate, become insensitive to out-of-distribution \textit{text} guidance. We investigate this behavior by analyzing the sampling trajectories of the generative model, and find that complex geometries can still be represented and produced by leveraging the model's unconditional generative prior. This leads to a more robust framework for text-based 3D shape editing that bypasses latent sinks by decoupling a model's geometric representation power from its linguistic sensitivity. Our approach addresses the limitations of current 3D pipelines and enables high-fidelity semantic manipulation of out-of-distribution 3D shapes. Project webpage: https://daidedou.sorpi.fr/publication/beyondprompts
- Abstract(参考訳): 生成モデルのテキスト駆動インバージョンは、2Dまたは3Dコンテンツを操作するためのコアパラダイムであり、テキストベースの編集、スタイル転送、逆問題などの多くのアプリケーションをアンロックする。
しかし、生成モデルは自然言語のプロンプトに敏感であるという仮定に依存している。
我々は、最先端のネイティブテキストから3D生成モデルにおいて、この仮定はしばしば崩壊することを示した。
我々は、生成軌跡を潜在する‘シンクトラップ’に描画するクリティカル障害モードを同定する。
これらの規則では、入力テキストの変更は出力幾何学を変更する方法で内部表現を変更することに失敗する。
重要なことに、これはモデルの \textit{geometric} 表現の制限ではない。同じ生成モデルは、非常に多様な形状を生成する能力を持っているが、私たちが示すように、分布外の \textit{text} ガイダンスには無関心になる。
生成モデルのサンプリング軌跡を解析することにより,この挙動を解明し,非条件生成前のモデルを用いて複雑なジオメトリを表現・生成できることを見出した。
これは、モデルの幾何学的表現力を言語的感度から切り離すことによって、潜水流をバイパスするテキストベースの3次元形状編集のためのより堅牢なフレームワークをもたらす。
提案手法は,現在の3次元パイプラインの限界に対処し,分布外3次元形状の高忠実な意味操作を可能にする。
プロジェクトWebページ: https://daidedou.sorpi.fr/publication/beyondprompts
関連論文リスト
- SIC3D: Style Image Conditioned Text-to-3D Gaussian Splatting Generation [5.068916657758997]
SIC3Dは3Dガウススプラッティングによる制御可能な画像調和型テキスト・ツー・3D生成パイプラインである(3DGS)
第1段階はテキストから3DGS生成モデルを用いてテキストから3Dオブジェクトコンテンツを生成する。
第2ステージは、参照画像から3DGSにスタイルを転送する。
論文 参考訳(メタデータ) (2026-04-09T20:50:49Z) - Image-Guided Geometric Stylization of 3D Meshes [23.354227809076345]
本稿では3次元メッシュを変形させて画像のスタイルを表現できる幾何学的スタイリングフレームワークを提案する。
我々の粗大なスタイリングパイプラインは、入力された3Dモデルを劇的に変形させ、多様な幾何学的バリエーションを表現できる。
また、メッシュレンダリングから効率よく信頼性の高い勾配を提供する、近似的なVAEエンコーダを提案する。
論文 参考訳(メタデータ) (2026-04-09T04:44:42Z) - Know3D: Prompting 3D Generation with Knowledge from Vision-Language Models [39.48274812723658]
Know3Dは、大規模言語モデルからの豊富な知識を3D生成プロセスに組み込む新しいフレームワークである。
抽象的な指示と未観測領域の幾何学的再構成のギャップを埋めることに成功した。
論文 参考訳(メタデータ) (2026-03-24T04:18:29Z) - Text-Image Conditioned 3D Generation [71.98375600100856]
TIGONは、イメージとテキスト条件のバックボーンと軽量なクロスモーダル融合を備えた、最小限のデュアルブランチベースラインである。
我々の診断研究は、テキストと画像条件の単純な融合でさえ、単一モダリティモデルよりも優れていることを示している。
大規模な実験により、テキスト画像の条件付けは単一モダリティ法よりも一貫して改善されることが示された。
論文 参考訳(メタデータ) (2026-03-22T15:36:16Z) - StdGEN++: A Comprehensive System for Semantic-Decomposed 3D Character Generation [57.06461272772509]
StdGEN++は、多種多様な入力から高忠実で意味的に分解された3D文字を生成するための、新しく包括的なシステムである。
最先端の性能を達成し、幾何学的精度と意味的絡み合いにおいて既存の手法を著しく上回っている。
結果として、非破壊的な編集、物理学に準拠したアニメーション、視線追跡など、より進んだ下流の機能をアンロックする。
論文 参考訳(メタデータ) (2026-01-12T15:41:27Z) - Shape from Semantics: 3D Shape Generation from Multi-View Semantics [30.969299308083723]
既存の3D再構成手法では, 3次元画像, 3次元点雲, 形状輪郭, 単一意味論などのガイダンスを用いて3次元表面を復元する。
図形や外観が、異なる視点から見ると、与えられたテキストの意味と一致した3Dモデルを作成することを目的として、新しい3Dモデリングタスク「Shape from Semantics'」を提案する。
論文 参考訳(メタデータ) (2025-02-01T07:51:59Z) - GaussianAnything: Interactive Point Cloud Flow Matching For 3D Object Generation [75.39457097832113]
本稿では,インタラクティブなポイントクラウド構造ラテント空間を備えたスケーラブルで高品質な3D生成を実現する,新しい3D生成フレームワークを提案する。
本フレームワークでは,複数ビューのRGB-D(epth)-N(ormal)レンダリングを入力として使用する変分オートエンコーダを,3次元形状情報を保存する独自のラテント空間設計を用いて構成する。
提案手法であるGaussianAnythingは,複数モード条件付き3D生成をサポートし,ポイントクラウド,キャプション,単一画像入力を可能にする。
論文 参考訳(メタデータ) (2024-11-12T18:59:32Z) - 3D Semantic Subspace Traverser: Empowering 3D Generative Model with
Shape Editing Capability [13.041974495083197]
従来の3次元形状生成の研究は、意味情報の重要性を考慮せずに、形状の質と構造に焦点を合わせてきた。
本稿では,3Dセマンティックサブスペーストラバーサという新しい意味生成モデルを提案する。
本手法は,複雑な構造を持つ可塑性形状を生成でき,意味的属性の編集を可能にする。
論文 参考訳(メタデータ) (2023-07-26T09:04:27Z) - Controllable 3D Generative Adversarial Face Model via Disentangling
Shape and Appearance [63.13801759915835]
3次元顔モデリングはコンピュータビジョンとコンピュータグラフィックスの研究の活発な領域である。
本稿では,識別と表現を分離できる新しい3次元顔生成モデルを提案する。
論文 参考訳(メタデータ) (2022-08-30T13:40:48Z) - Disentangled3D: Learning a 3D Generative Model with Disentangled
Geometry and Appearance from Monocular Images [94.49117671450531]
最先端の3D生成モデルは、合成に神経的な3Dボリューム表現を使用するGANである。
本稿では,単分子観察だけで物体の絡み合ったモデルを学ぶことができる3D GANを設計する。
論文 参考訳(メタデータ) (2022-03-29T22:03:18Z) - SNARF: Differentiable Forward Skinning for Animating Non-Rigid Neural
Implicit Shapes [117.76767853430243]
SNARFは多角形メッシュに対する線形ブレンドスキンの利点とニューラル暗黙表面の利点を組み合わせたものである。
反復ルート探索を用いて任意の変形点のすべての正準対応を探索するフォワードスキンモデルを提案する。
最先端のニューラルネットワークの暗黙的表現と比較すると,このアプローチは,精度を維持しつつ,未認識のポーズを一般化する。
論文 参考訳(メタデータ) (2021-04-08T17:54:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。