論文の概要: BRepCLIP: Contrastive Multimodal Pretraining on BRep Primitives for CAD Understanding
- arxiv url: http://arxiv.org/abs/2606.05515v1
- Date: Wed, 03 Jun 2026 23:41:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-06 06:55:34.620063
- Title: BRepCLIP: Contrastive Multimodal Pretraining on BRep Primitives for CAD Understanding
- Title(参考訳): BRepCLIP:CAD理解のためのBRep Primitivesを用いたコントラストマルチモーダルプレトレーニング
- Authors: Muhammad Usama, Didier Stricker, Mohammad Sadil Khan, Muhammad Zeshan Afzal,
- Abstract要約: BRepの幾何学を言語や画像の埋め込みと整合させる最初のフレームワークであるBRepCLIPを紹介する。
トランスフォーマーエンコーダはこれらのトークンをグローバルなBRep埋め込みに集約し、CLIPのテキストとイメージエンコーダと整列する。
BRepCLIPは、既存の点ベースの代替よりも差別的で意味論的に基礎付けられた埋め込みを生成する。
- 参考スコア(独自算出の注目度): 22.960026011165706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning representations of CAD models is a largely open problem. While 3D representation learning has flourished around point clouds and meshes, the native format of CAD - boundary representations BReps, which encodes exact parametric surfaces, curves, and their topology, has received little attention as a representation learning substrate. We introduce BRepCLIP, the first framework to align BRep geometry with language and image embeddings through contrastive pretraining. We model each CAD object as a sequence of face and edge tokens with separate discrete vocabularies for surface and curve geometry, augmented with spatial and semantic descriptors that capture surface types (e.g., cylindrical, torus, NURBS) and curve primitives (e.g., line, arc, B-spline). A transformer encoder aggregates these tokens into a global BRep embedding, aligned with CLIP's text and image encoders via a joint contrastive objective. BRepCLIP generates more discriminative and semantically grounded embeddings than existing point-based alternatives, improving Top-1 retrieval over OpenShape by 40.4%, 22.0%, and 23.9% on ABC, CADParser, and Automate, respectively, and improving zero-shot classification on FabWave by 15% in Top-1 score. We further demonstrate its utility as a CAD-aware similarity metric for evaluating text and image-conditioned CAD generation, establishing the importance of structure-aware pretraining for multimodal CAD understanding. Project page is available at https://muhammadusama100.github.io/BrepClip2026/
- Abstract(参考訳): CADモデルの表現を学習することは、ほとんどオープンな問題である。
3D表現学習は、点雲やメッシュを中心に盛んに行われているが、CADのネイティブフォーマットである境界表現BRepsは、正確なパラメトリック曲面、曲線、およびそれらのトポロジを符号化しているが、表現学習基板としてはほとんど注目されていない。
本稿では,BRep 幾何学を言語や画像の埋め込みと整合させる最初のフレームワークである BRepCLIP を紹介する。
我々は,各CADオブジェクトを面と辺のトークンの列として表層と曲線を分離した語彙でモデル化し,曲面タイプ(例えば,円筒形,トーラス,NURBS)と曲線プリミティブ(例えば,直線,弧,B-スプライン)をキャプチャする空間的および意味的記述子で拡張する。
トランスフォーマーエンコーダは、これらのトークンをグローバルなBRep埋め込みに集約し、CLIPのテキストと画像エンコーダとをジョイントコントラストの目的によって一致させる。
BRepCLIPは既存のポイントベースよりも差別的でセマンティックな埋め込みを生成し、ABC、CADParser、AutomateでOpenShape上のTop-1検索を40.4%、22.0%、23.9%改善し、Top-1スコアでFabWaveのゼロショット分類を15%改善した。
さらに、テキストと画像調和CAD生成の評価のためのCAD対応類似度指標としての有用性を実証し、マルチモーダルCAD理解のための構造認識事前学習の重要性を確立した。
プロジェクトページはhttps://muhammadusama100.github.io/BrepClip2026/で公開されている。
関連論文リスト
- DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces [67.45867367326105]
ポイントレベルの監視から編集可能なBRepsを直接生成するマルチモーダル生成フレームワークであるDreamCADを提案する。
DreamCADは、各BRepをパラメトリックパッチの集合として表現し、メッシュを生成するために微分可能なテッセルレーション手法を使用する。
DreamCADはABCの最先端のパフォーマンスを達成し、テキスト、画像、点のモダリティにまたがるベンチマークを行う。
論文 参考訳(メタデータ) (2026-03-05T19:04:07Z) - BrepGaussian: CAD reconstruction from Multi-View Images with Gaussian Splatting [21.289489202626534]
境界表現(B-rep)は、その明示的な境界として3次元固体をモデル化する。
ディープラーニングの最近の進歩は、3次元形状の復元を大幅に改善した。
2次元画像から3次元パラメトリック表現を学習する新しいフレームワークであるB-rep Splattingを提案する。
論文 参考訳(メタデータ) (2026-02-24T17:03:45Z) - BrepGPT: Autoregressive B-rep Generation with Voronoi Half-Patch [61.20046418942948]
境界表現(B-rep)はCADモデル表現のデファクトスタンダードである。
本稿では,B-rep生成のためのシングルステージ自動回帰フレームワークBrepGPTを提案する。
論文 参考訳(メタデータ) (2025-11-27T07:16:53Z) - CMT: A Cascade MAR with Topology Predictor for Multimodal Conditional CAD Generation [59.76687657887415]
境界表現(B-Rep)に基づくCAD生成のための最初のマルチモーダルフレームワークであるトポロジ予測器(CMT)を用いたカスケードMARを提案する。
具体的には、カスケードMARは、B-Repsに必須のエッジカウンタ面の先行情報を効果的にキャプチャすることができる。
マルチモーダルアノテーション付きB-Repモデルを含む大規模マルチモーダルCADデータセットmmABCを開発した。
論文 参考訳(メタデータ) (2025-04-29T14:52:28Z) - HoLa: B-Rep Generation using a Holistic Latent Representation [51.07878285790399]
我々は、$textitboundary representations$ (B-Reps)という形式でコンピュータ支援設計(CAD)モデルを学習し、生成するための新しい表現を導入する。
我々の表現は、B-Repプリミティブの連続幾何学的性質を異なる順序で統一する。
提案手法は生成したB-Repプリミティブ間のあいまいさ,冗長性,不整合性を著しく低減する。
論文 参考訳(メタデータ) (2025-04-19T10:34:24Z) - Constraint-Aware Feature Learning for Parametric Point Cloud [19.190053031718417]
パラメトリック点雲はCAD形状から採取され、工業生産においてますます一般的になりつつある。
CAD固有の深層学習法の多くは幾何学的特徴に重点を置いており、CADの形状に固有の制約を見下ろしている。
3つのコンポーネントによるディープラーニングに優しい制約表現を導入し、制約対応機能学習ネットワーク(CstNet)を設計する。
CstNetは、パラメトリックポイントクラウド分析に適した、制約を意識した最初のディープラーニング手法である。
論文 参考訳(メタデータ) (2024-11-12T12:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。