論文の概要: Img2CADSeq: Image-to-CAD Generation via Sequence-Based Diffusion
- arxiv url: http://arxiv.org/abs/2605.13293v1
- Date: Wed, 13 May 2026 10:06:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.971596
- Title: Img2CADSeq: Image-to-CAD Generation via Sequence-Based Diffusion
- Title(参考訳): Img2CADSeq:シーケンスベース拡散による画像からCAD生成
- Authors: Shiyu Tan, Zixuan Zhao, Hao Gao, Zhiheng Chen, Xiaolong Yin, Enya Shen,
- Abstract要約: 境界表現はCAD(Computer-Aided Design)の標準フォーマットである
Img2CADSeqは,CADシーケンスを3レベル階層のコードブックに符号化することで,制限を克服する多段階パイプラインである。
- 参考スコア(独自算出の注目度): 10.432531054049681
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Boundary Representation (BRep) is the standard format for Computer-Aided Design (CAD), yet reconstructing high-quality BReps from single-view images remains challenging due to the complexity of topological constraints and operation sequences. We present Img2CADSeq, a multi-stage pipeline that overcomes these limitations by encoding CAD sequences into a three-level hierarchical codebook. Guided by an importance prioritization, this strategy values profiles over details, compressing long sequences into a stable discrete latent space. To bridge the modality gap, we leverage a coarse-to-fine point cloud intermediate, aligning 2D visual features with 3D CAD sequences via contrastive learning to condition a VQ-Diffusion model. Supported by newly introduced CAD-220K and PrintCAD datasets, our approach ensures robust industrial domain adaptation. Extensive experiments demonstrate that Img2CADSeq significantly outperforms state-of-the-art methods, producing standard STEP files that can be directly used in commercial CAD software.
- Abstract(参考訳): 境界表現(BRep)はCAD(Computer-Aided Design)の標準フォーマットであるが、トポロジ的制約や操作シーケンスの複雑さのため、シングルビュー画像から高品質なBRepsを再構成することは依然として困難である。
Img2CADSeqは,CADシーケンスを3段階の階層コードブックに符号化することで,これらの制限を克服する多段階パイプラインである。
重要な優先順位付けによって導かれるこの戦略は、細部よりもプロファイルを値し、長い列を安定な離散潜在空間に圧縮する。
モダリティギャップを埋めるため,VQ-拡散モデルを用いて2次元視覚特徴と3次元CADシーケンスを整列させて,粗い点間クラウド中間体を利用する。
CAD-220KとPrintCADデータセットが新たに導入し,産業領域の堅牢な適応を実現する。
大規模な実験により、Img2CADSeqは最先端の手法よりも優れており、商用CADソフトウェアで直接使用できる標準のSTEPファイルを生成する。
関連論文リスト
- GeoFusion-CAD: Structure-Aware Diffusion with Geometric State Space for Parametric 3D Design [10.120364226524417]
CAD(Parametric Computer-Aided Design)は、現代の3Dモデリングの基本である。
既存のメソッドは長いコマンドシーケンスを生成するのに苦労する。
スケーラブルかつ構造対応な生成のためのエンドツーエンド拡散フレームワークであるGeoFusion-CADを提案する。
論文 参考訳(メタデータ) (2026-03-23T13:41:39Z) - GACO-CAD: Geometry-Augmented and Conciseness-Optimized CAD Model Generation from Single Image [11.612167656421079]
マルチモーダル大言語モデル(MLLM)は2次元画像から3次元幾何学を正確に推定するのに依然として苦労している。
本稿では,新しい2段階後学習フレームワークGACO-CADを紹介する。
DeepCADとFusion360データセットの実験は、GACO-CADが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2025-10-20T04:57:20Z) - CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.342222156939403]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文 参考訳(メタデータ) (2025-05-31T13:52:56Z) - CMT: A Cascade MAR with Topology Predictor for Multimodal Conditional CAD Generation [59.76687657887415]
境界表現(B-Rep)に基づくCAD生成のための最初のマルチモーダルフレームワークであるトポロジ予測器(CMT)を用いたカスケードMARを提案する。
具体的には、カスケードMARは、B-Repsに必須のエッジカウンタ面の先行情報を効果的にキャプチャすることができる。
マルチモーダルアノテーション付きB-Repモデルを含む大規模マルチモーダルCADデータセットmmABCを開発した。
論文 参考訳(メタデータ) (2025-04-29T14:52:28Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - Revisiting CAD Model Generation by Learning Raster Sketch [17.853025952444437]
本稿では,ラースタースケッチとCADモデルの3次元押出形を生成する新しいフレームワークであるRECADを紹介する。
2つの拡散ネットワークを組み合わせることで、RECADはスケッチ・アンド・エクストルードCADモデルを効果的に生成する。
論文 参考訳(メタデータ) (2025-03-02T15:11:35Z) - CADSpotting: Robust Panoptic Symbol Spotting on Large-Scale CAD Drawings [56.05238657033198]
本稿では,大規模CAD図面におけるパノプティカルシンボルスポッティングの効果的な方法であるCADSpottingを紹介する。
また、重み付き投票とNon-Maximum Suppression(NMS)を組み合わせたSWA(Sliding Window Aggregation)手法を提案する。
FloorPlanCAD と LS-CAD の実験により,CADSpotting が既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-12-10T10:22:17Z) - Img2CAD: Reverse Engineering 3D CAD Models from Images through VLM-Assisted Conditional Factorization [29.177153478213366]
画像からのリバースエンジニアリング3Dコンピュータ支援設計(CAD)モデルは、多くのダウンストリームアプリケーションにとって重要な課題である。
本研究では,タスクを2つのサブプロブレムに条件付き分解する手法を提案する。
本稿では,個別構造にセマンティクスを組み込んだTrAssemblerを提案し,連続的な属性値を予測する。
論文 参考訳(メタデータ) (2024-07-19T06:53:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。