論文の概要: Reconstruction of a 3D wireframe from a single line drawing via generative depth estimation
- arxiv url: http://arxiv.org/abs/2604.13549v1
- Date: Wed, 15 Apr 2026 06:52:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.422951
- Title: Reconstruction of a 3D wireframe from a single line drawing via generative depth estimation
- Title(参考訳): 生成深度推定による単線描画からの3次元ワイヤフレームの再構成
- Authors: Elton Cao, Hod Lipson,
- Abstract要約: 2Dフリーハンドスケッチを3Dモデルに変換することは、コンピュータビジョンにおいて重要な課題である。
本研究では, 条件付き深度推定タスクとして, フレーミング再構成による生成手法を提案する。
我々は、100万以上の画像深度対の巨大なデータセットを使用して、我々のアプローチを訓練し、評価する。
- 参考スコア(独自算出の注目度): 5.596217605600402
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The conversion of 2D freehand sketches into 3D models remains a pivotal challenge in computer vision, bridging the gap between human creativity and digital fabrication. Traditional line drawing reconstruction relies on brittle symbolic logic, while modern approaches are constrained by rigid parametric modeling, limiting users to predefined CAD primitives. We propose a generative approach by framing reconstruction as a conditional dense depth estimation task. To achieve this, we implement a Latent Diffusion Model (LDM) with a ControlNet-style conditioning framework to resolve the inherent ambiguities of orthographic projections. To support an iterative "sketch-reconstruct-sketch" workflow, we introduce a graph-based BFS masking strategy to simulate partial depth cues. We train and evaluate our approach using a massive dataset of over one million image-depth pairs derived from the ABC Dataset. Our framework demonstrates robust performance across varying shape complexities, providing a scalable pipeline for converting sparse 2D line drawings into dense 3D representations, effectively allowing users to "draw in 3D" without the rigid constraints of traditional CAD.
- Abstract(参考訳): 2Dのフリーハンドスケッチを3Dモデルに変換することは、コンピュータビジョンにおいて重要な課題であり、人間の創造性とデジタル製作のギャップを埋めている。
伝統的な線描再構成は脆い記号論理に依存し、現代のアプローチは厳密なパラメトリックモデリングによって制約され、ユーザーは事前に定義されたCADプリミティブに制限される。
本研究では, 条件付き深度推定タスクとして, フレーミング再構成による生成手法を提案する。
これを実現するために、直交射影の固有の曖昧さを解決するために、制御ネットスタイルの条件付けフレームワークを備えた潜在拡散モデル(LDM)を実装した。
反復的な「スケッチ・リコンストラクト・スケッチ」ワークフローをサポートするため、グラフベースのBFSマスキング戦略を導入し、部分深度をシミュレートする。
ABCデータセットから得られた100万以上の画像深度対の膨大なデータセットを用いて、我々のアプローチを訓練し、評価する。
筆者らのフレームワークは, 様々な形状の複雑度にまたがる堅牢な性能を示し, スパース2次元線描画を高密度な3次元表現に変換するためのスケーラブルなパイプラインを提供し, 従来のCADの厳密な制約を伴わずに, ユーザが「3Dで描画できる」。
関連論文リスト
- IGGT: Instance-Grounded Geometry Transformer for Semantic 3D Reconstruction [82.53307702809606]
人間は自然に3次元世界の幾何学的構造と意味的内容を中間次元として知覚する。
本稿では,空間再構成とインスタンスレベルの文脈理解の両面での知識を統合するために,IGGT (InstanceGrounded Geometry Transformer) を提案する。
論文 参考訳(メタデータ) (2025-10-26T14:57:44Z) - A Controllable 3D Deepfake Generation Framework with Gaussian Splatting [6.969908558294805]
本稿では,3次元ガウススプラッティングに基づく新しい3次元ディープフェイク生成フレームワークを提案する。
完全に制御可能な3D空間において、現実的でアイデンティティを保った顔スワッピングと再現を可能にする。
提案手法は3次元モデリングとディープフェイク合成のギャップを埋め、シーン認識、制御可能、没入型視覚的偽造の新しい方向を可能にする。
論文 参考訳(メタデータ) (2025-09-15T06:34:17Z) - From 2D CAD Drawings to 3D Parametric Models: A Vision-Language Approach [15.785592359384292]
2次元CAD図面から3次元パラメトリックモデルを再構成するCAD2Programを提案する。
本稿では、2D CAD描画を元のフォーマットによらず画像として扱い、標準の ViT モデルで画像をエンコードする。
出力側では,本手法はテキスト形式で3次元パラメトリックモデルを記述する汎用言語を自動回帰予測する。
論文 参考訳(メタデータ) (2024-12-16T15:41:14Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。