論文の概要: JanusMesh: Fast and Zero-Shot 3D Visual Illusion Generation via Cross-Space Denoising
- arxiv url: http://arxiv.org/abs/2606.20563v1
- Date: Thu, 18 Jun 2026 17:59:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:40.058276
- Title: JanusMesh: Fast and Zero-Shot 3D Visual Illusion Generation via Cross-Space Denoising
- Title(参考訳): JanusMesh: クロススペースデノーミングによる高速でゼロショットの3Dビジュアルイリュージョン生成
- Authors: Siang-Ling Zhang, Huai-Hsun Cheng, Tsung-Ju Yang, Yu-Lun Liu,
- Abstract要約: テキスト駆動型3次元視覚錯覚を生成するためのフレームワークを提案する。
提案手法は,3~5分で2次元のリアルな3Dイリュージョンを生成できる。
これは、幾何学的整合性、意味認識可能性、効率性において既存の手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 4.625351881266883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating 3D visual illusions, a single 3D mesh that reveals entirely different semantics from various viewing angles, is a fascinating but tough challenge. Existing optimization-based methods are slow and can produce oversaturated colors. In contrast, naive stitching approaches fail to produce geometrically coherent objects. This results in visible unnatural seams and semantic leaks. In this paper, we present a fast and training-free framework for generating text-driven 3D visual illusions. Our approach decouples the generation into two stages. First, we propose a cross-space dual-branch denoising process. This process dynamically decodes 3D latents into voxel space for CLIP-guided orientation alignment and Signed Distance Field (SDF) blending, which ensures seamless geometric fusion. Second, we introduce a view-conditioned texture synthesis module that projects and aggregates view-specific 2D diffusion priors onto the fused geometry. Extensive experiments demonstrate that our method generates highly realistic, dual-semantic 3D illusions in just 3-5 minutes. It significantly outperforms existing methods in geometric integrity, semantic recognizability, and efficiency. Project page: https://siang1105.github.io/JanusMesh.github.io/
- Abstract(参考訳): 3Dの視覚的錯覚を作るのは、1つの3Dメッシュで、さまざまな角度から完全に異なるセマンティクスを表現している。
既存の最適化ベースの手法は遅く、過飽和色を生成できる。
対照的に、単純縫合法は幾何学的に整合性のある物体を生成するのに失敗する。
この結果、目に見えない不自然な縫い目と意味的な漏れが生じる。
本稿では,テキスト駆動型3次元視覚錯覚を生成するための,高速かつトレーニング不要なフレームワークを提案する。
我々のアプローチは世代を2つの段階に分離する。
まず,クロススペースなデュアルブランチ・デノゲーションプロセスを提案する。
このプロセスは、3DラテントをCLIP誘導配向アライメントと符号距離場(SDF)ブレンディングのためのボクセル空間に動的にデコードし、シームレスな幾何学的融合を実現する。
第二に、ビュー条件付きテクスチャ合成モジュールを導入し、ビュー固有の2次元拡散先行を融合幾何学に投影し、集約する。
広汎な実験により,本手法は3~5分で高現実的で2次元の錯覚を発生させることが示された。
これは、幾何学的整合性、意味認識可能性、効率性において既存の手法を著しく上回っている。
プロジェクトページ: https://siang1105.github.io/JanusMesh.github.io/
関連論文リスト
- OneWorld: Taming Scene Generation with 3D Unified Representation Autoencoder [90.8453349494245]
本研究では,コヒーレントな3次元表現空間内で直接拡散を行うOneWorldを提案する。
OneWorldは、最先端の2Dベースの方法と比較して、クロスビューの一貫性に優れた高品質な3Dシーンを生成する。
論文 参考訳(メタデータ) (2026-03-17T03:43:37Z) - Interp3D: Correspondence-aware Interpolation for Generative Textured 3D Morphing [63.141976759536625]
テクスチャ化された3DモーフィングのためのトレーニングフリーフレームワークであるInterp3Dを提案する。
生成的先行性を利用し、幾何学的忠実さとテクスチャコヒーレンスの両方を保証するために、プログレッシブアライメント原理を採用する。
包括的評価のために, 難易度の高い専用データセットInterp3DDataを構築し, 忠実度, 遷移滑らか度, 可視性から生成結果を評価する。
論文 参考訳(メタデータ) (2026-01-20T16:03:22Z) - Vista3D: Unravel the 3D Darkside of a Single Image [64.00066024235088]
Vista3Dは、わずか5分で素早く一貫した3D生成を実現するフレームワークである。
粗い位相では、1つの画像からガウススプラッティングで初期幾何学を高速に生成する。
2つの独立な暗黙関数を持つ非絡み合った表現を使用することで、生成の質を高める。
論文 参考訳(メタデータ) (2024-09-18T17:59:44Z) - A3D: Does Diffusion Dream about 3D Alignment? [73.97853402817405]
幾何学的アライメントの観点からテキスト駆動型3D生成の問題に取り組む。
テキストプロンプトのセットが与えられたら、意味的に対応する部分同士が整列したオブジェクトの集合を生成することを目指している。
我々は、これらのオブジェクトを共通の潜在空間に埋め込み、これらのオブジェクト間の連続的な遷移を最適化することを提案する。
論文 参考訳(メタデータ) (2024-06-21T09:49:34Z) - Magic123: One Image to High-Quality 3D Object Generation Using Both 2D
and 3D Diffusion Priors [104.79392615848109]
Magic123は、高品質でテクスチャ化された3Dメッシュのための、2段階の粗大なアプローチである。
最初の段階では、粗い幾何学を生成するために、神経放射場を最適化する。
第2段階では、視覚的に魅力的なテクスチャを持つ高分解能メッシュを生成するために、メモリ効率のよい微分可能なメッシュ表現を採用する。
論文 参考訳(メタデータ) (2023-06-30T17:59:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。