論文の概要: Sketch2MinSurf: Vision-Language Guided Generation of Editable Minimal Surfaces from Hand-Drawn Sketches
- arxiv url: http://arxiv.org/abs/2605.20733v1
- Date: Wed, 20 May 2026 05:37:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.498298
- Title: Sketch2MinSurf: Vision-Language Guided Generation of Editable Minimal Surfaces from Hand-Drawn Sketches
- Title(参考訳): Sketch2MinSurf:手描きスケッチから編集可能な最小表面を生成するビジョンランゲージガイド
- Authors: Wenda Wang, Anqi Liu, Junqi Yang, Lei He, Luying Wang, Jiachen Lu, Weixin Huang,
- Abstract要約: スケッチ2MinSurfは、手描きスケッチから3次元表面を生成するハイブリッド視覚言語および幾何学的フレームワークである。
100のスケッチからなるテストセットでは、Sketch2MinSurfが0.844のトポロジ的類似点を獲得し、既存のスケッチ・ツー・シェイプベースラインを上回っている。
- 参考スコア(独自算出の注目度): 19.571482380413794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Converting hand-drawn sketches into structured 3D geometries remains challenging due to the difficulty of representing non-Euclidean surfaces and maintaining topological consistency. Existing generative models such as GANs, NeRFs, and diffusion architectures often fail to produce editable manifolds directly usable in downstream design workflows. We present Sketch2MinSurf, a hybrid vision-language and geometric optimization framework that integrates vision-language guidance with minimal-surface theory to generate smooth and editable 3D surfaces from hand-drawn sketches. The core of our approach is a spatial-topological encoding that represents geometry as tuples of node coordinates and real/virtual edge skeletons, enabling stable topological control during generation. We further introduce the Sketch2MinSurf Structural Loss (S2MS-Loss), a reward-modulated objective that jointly constrains geometric reconstruction and topological coherence. On a test set of 100 sketches, Sketch2MinSurf achieves a topological similarity score of 0.844, outperforming existing sketch-to-shape baselines. The generated manifolds are directly editable and free from non-manifold artifacts. A public art installation at a university showcases the method's potential for human-intent-driven 3D form generation. The dataset and code are available at https://anonymous.4open.science/r/Sketch2MinSurf/.
- Abstract(参考訳): 非ユークリッド曲面の表現が困難であり、位相的整合性を維持するため、手描きのスケッチを構造化された3次元幾何学に変換することは依然として困難である。
GAN、NeRF、拡散アーキテクチャといった既存の生成モデルは、下流の設計ワークフローで直接使用可能な編集可能な多様体を作成できないことが多い。
スケッチ2MinSurfは、視覚言語と幾何学のハイブリッドな最適化フレームワークで、視覚言語指導と最小表面理論を統合し、手描きスケッチから滑らかで編集可能な3次元表面を生成する。
提案手法のコアは空間トポロジカルエンコーディングであり,ノード座標と実・仮想端骨格のタプルとして幾何学を表現し,生成時に安定したトポロジ的制御を可能にする。
また,Sketch2MinSurf構造損失(S2MS-Loss)についても紹介する。
100のスケッチからなるテストセットでは、Sketch2MinSurfが0.844のトポロジ的類似点を獲得し、既存のスケッチ・ツー・シェイプベースラインを上回っている。
生成された多様体は直接編集可能であり、非多様体アーティファクトを含まない。
大学のパブリックアートインスタレーションでは、人間のインテリジェント駆動による3Dフォーム生成の可能性を示す。
データセットとコードはhttps://anonymous.4open.science/r/Sketch2MinSurf/で公開されている。
関連論文リスト
- Spherical Geometry Diffusion: Generating High-quality 3D Face Geometry via Sphere-anchored Representations [18.442834011472005]
テキストから3Dの顔生成における根本的な課題は、高品質な幾何学を実現することである。
球面座標に幾何学的信号を固定する新しい顔表現である球面幾何表現を導入する。
次に、この2次元マップ上に構築された条件拡散フレームワークである球拡散幾何学を紹介する。
論文 参考訳(メタデータ) (2026-01-19T20:15:45Z) - sketch2symm: Symmetry-aware sketch-to-shape generation via semantic bridging [12.390999095290404]
スケッチから幾何学的に一貫した3Dを生成する2段階生成法であるSketch2Symmを提案する。
本手法では,スケッチ・ツー・イメージ変換によるセマンティック・ブリッジングを導入し,スパース・スケッチ表現を充実させる。
提案手法は,既存のスケッチベース再構築手法に比べて,シャンファー距離,アースモーバー距離,Fスコアの面で優れた性能を実現する。
論文 参考訳(メタデータ) (2025-10-13T11:49:45Z) - Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification [59.17489431187807]
本稿では,CLIPの階層的空間意味論を活用することで3次元幾何学的忠実度を高めるフレームワークを提案する。
本手法は3次元のクラスインクリメンタル学習を著しく改善し,テクスチャバイアスに対して優れた幾何コヒーレンスとロバスト性を実現する。
論文 参考訳(メタデータ) (2025-09-18T13:45:08Z) - Shape from Semantics: 3D Shape Generation from Multi-View Semantics [30.969299308083723]
既存の3D再構成手法では, 3次元画像, 3次元点雲, 形状輪郭, 単一意味論などのガイダンスを用いて3次元表面を復元する。
図形や外観が、異なる視点から見ると、与えられたテキストの意味と一致した3Dモデルを作成することを目的として、新しい3Dモデリングタスク「Shape from Semantics'」を提案する。
論文 参考訳(メタデータ) (2025-02-01T07:51:59Z) - Ghost on the Shell: An Expressive Representation of General 3D Shapes [97.76840585617907]
リアルな素材と照明で高速な物理ベースのレンダリングを可能にするので、メッシュは魅力的だ。
近年の3次元形状の再構成と統計的モデリングの研究は、メッシュをトポロジカルに非フレキシブルであると批判している。
我々は水密面上の多様体符号距離場を定義することにより開曲面をパラメータ化する。
G-Shellは、非水密メッシュ再構築および生成タスクにおける最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-10-23T17:59:52Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Neural Convolutional Surfaces [59.172308741945336]
この研究は、大域的、粗い構造から、微細で局所的で、おそらく繰り返される幾何学を歪める形状の表現に関係している。
このアプローチは, 最先端技術よりも優れたニューラル形状圧縮を実現するとともに, 形状詳細の操作と伝達を可能にする。
論文 参考訳(メタデータ) (2022-04-05T15:40:11Z) - Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D
Shape Synthesis [90.26556260531707]
DMTetは粗いボクセルのような単純なユーザーガイドを用いて高解像度の3次元形状を合成できる条件付き生成モデルである。
メッシュなどの明示的な表現を直接生成する深部3次元生成モデルとは異なり、我々のモデルは任意の位相で形状を合成することができる。
論文 参考訳(メタデータ) (2021-11-08T05:29:35Z) - Deep Geometric Texture Synthesis [83.9404865744028]
幾何学的テクスチャを合成するための新しい枠組みを提案する。
単一の参照3Dモデルの局所的な近傍からテクスチャ統計を学習する。
我々のネットワークはメッシュ頂点を任意の方向に変位させ、幾何学的テクスチャの合成を可能にする。
論文 参考訳(メタデータ) (2020-06-30T19:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。