論文の概要: ArchCAD-400K: An Open Large-Scale Architectural CAD Dataset and New Baseline for Panoptic Symbol Spotting
- arxiv url: http://arxiv.org/abs/2503.22346v1
- Date: Fri, 28 Mar 2025 11:40:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-31 15:29:28.004652
- Title: ArchCAD-400K: An Open Large-Scale Architectural CAD Dataset and New Baseline for Panoptic Symbol Spotting
- Title(参考訳): ArchCAD-400K: オープンな大規模CADデータセットとパノプティカルシンボルスポッティングのための新しいベースライン
- Authors: Ruifeng Luo, Zhengjie Liu, Tianxiao Cheng, Jie Wang, Tongjie Wang, Xingguang Wei, Haomin Wang, YanPeng Li, Fu Chai, Fei Cheng, Shenglong Ye, Wenhai Wang, Yanting Zhang, Yu Qiao, Hongjie Zhang, Xianzhong Zhao,
- Abstract要約: ArchCAD-400Kは5538の高度に標準化された図面から413,062個のチャンクからなる大規模CADデータセットである。
我々は、Dual-Pathway Symbol Spotter (DPSS)と呼ばれる、汎視的シンボルスポッティングのための新しいベースラインモデルを提案する。
- 参考スコア(独自算出の注目度): 31.42708936135226
- License:
- Abstract: Recognizing symbols in architectural CAD drawings is critical for various advanced engineering applications. In this paper, we propose a novel CAD data annotation engine that leverages intrinsic attributes from systematically archived CAD drawings to automatically generate high-quality annotations, thus significantly reducing manual labeling efforts. Utilizing this engine, we construct ArchCAD-400K, a large-scale CAD dataset consisting of 413,062 chunks from 5538 highly standardized drawings, making it over 26 times larger than the largest existing CAD dataset. ArchCAD-400K boasts an extended drawing diversity and broader categories, offering line-grained annotations. Furthermore, we present a new baseline model for panoptic symbol spotting, termed Dual-Pathway Symbol Spotter (DPSS). It incorporates an adaptive fusion module to enhance primitive features with complementary image features, achieving state-of-the-art performance and enhanced robustness. Extensive experiments validate the effectiveness of DPSS, demonstrating the value of ArchCAD-400K and its potential to drive innovation in architectural design and construction.
- Abstract(参考訳): アーキテクチャCAD描画におけるシンボルの認識は、様々な高度な工学的応用において重要である。
本稿では,系統的にアーカイブされたCAD図面から固有の属性を利用して,高品質なアノテーションを自動的に生成する新しいCADデータアノテーションエンジンを提案する。
このエンジンを利用することで、5538の高度に標準化された図面から413,062個のチャンクからなる大規模CADデータセットArchCAD-400Kを構築し、既存の最大CADデータセットの26倍以上の規模となる。
ArchCAD-400Kは、拡張された図面の多様性とより広いカテゴリを持ち、ライングレードのアノテーションを提供している。
さらに,本研究では,Dual-Pathway Symbol Spotter (DPSS) と呼ばれる,汎視的シンボルスポッティングのための新しいベースラインモデルを提案する。
適応的な融合モジュールを組み込んで、補完的な画像特徴を持つプリミティブ機能を強化し、最先端のパフォーマンスと堅牢性の向上を実現している。
大規模な実験によりDPSSの有効性が検証され、ArchCAD-400Kの価値と、建築設計と建設における革新を促進する可能性を示す。
関連論文リスト
- CADSpotting: Robust Panoptic Symbol Spotting on Large-Scale CAD Drawings [21.512025767558498]
CADSpottingは、座標や色などの属性で高密度にサンプリングされた点を通してプリミティブを表現する。
重み付き投票と非最大抑圧(NMS)を組み合わせたスライディングウィンドウ集約(SWA)手法を提案する。
FloorPlanCADとLS-CADデータセットの実験は、CADSpottingが既存の手法よりも大幅に優れていることを示している。
論文 参考訳(メタデータ) (2024-12-10T10:22:17Z) - Text2CAD: Text to 3D CAD Generation via Technical Drawings [45.3611544056261]
Text2CADは、生成プロセスを自動化するために調整された安定した拡散モデルを利用する新しいフレームワークである。
テキスト2CADは,高品質な3次元CADモデルに正確に変換された技術図面を効果的に生成することを示す。
論文 参考訳(メタデータ) (2024-11-09T15:12:06Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - Img2CAD: Conditioned 3D CAD Model Generation from Single Image with Structured Visual Geometry [12.265852643914439]
編集可能なパラメータを生成するために2次元画像入力を用いた最初の知識であるImg2CADを提案する。
Img2CADはAI 3D再構成とCAD表現のシームレスな統合を可能にする。
論文 参考訳(メタデータ) (2024-10-04T13:27:52Z) - PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.726941702182]
再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文 参考訳(メタデータ) (2024-05-24T03:43:55Z) - ContrastCAD: Contrastive Learning-based Representation Learning for Computer-Aided Design Models [0.7373617024876725]
本稿では,ContrastCAD という,CAD モデルを学習するための対照的な学習手法を提案する。
コントラストCADはCADモデルの構成シーケンス内の意味情報を効果的にキャプチャする。
また,RRE法(Random Replace and Extrude)と呼ばれる新しいCADデータ拡張手法を提案し,モデルの学習性能を向上させる。
論文 参考訳(メタデータ) (2024-04-02T05:30:39Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z) - Patch2CAD: Patchwise Embedding Learning for In-the-Wild Shape Retrieval
from a Single Image [58.953160501596805]
本稿では,2次元画像と3次元CADモデルの結合埋め込み空間をパッチワイズで構築する手法を提案する。
我々のアプローチは、CADが正確に一致しない実世界のシナリオにおける最先端技術よりも堅牢である。
論文 参考訳(メタデータ) (2021-08-20T20:58:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。