論文の概要: BrepCoder: A Unified Multimodal Large Language Model for Multi-task B-rep Reasoning
- arxiv url: http://arxiv.org/abs/2602.22284v1
- Date: Wed, 25 Feb 2026 12:44:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.352678
- Title: BrepCoder: A Unified Multimodal Large Language Model for Multi-task B-rep Reasoning
- Title(参考訳): BrepCoder:マルチタスクB-rep推論のための統合マルチモーダル大言語モデル
- Authors: Mingi Kim, Yongjun Kim, Jungwoo Kang, Hyungki Kim,
- Abstract要約: B-rep入力から多様なCADタスクを実行するPythonライクな大規模言語モデル(MLLM)であるBrepCoderを提案する。
LLMのコード生成機能を活用することで、CADモデリングシーケンスをPythonライクなコードに変換し、B-repと整合させる。
- 参考スコア(独自算出の注目度): 4.393837288225634
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advancements in deep learning have actively addressed complex challenges within the Computer-Aided Design (CAD) domain.However, most existing approaches rely on task-specifi c models requiring structural modifi cations for new tasks, and they predominantly focus on point clouds or images rather than the industry-standard Boundary Representation (B-rep) format. To address these limitations, we propose BrepCoder, a unifi ed Multimodal Large Language Model (MLLM) that performs diverse CAD tasks from B-rep inputs. By leveraging the code generation capabilities of Large Language Models (LLMs), we convert CAD modeling sequences into Python-like code and align them with B-rep. We then adopt a two-stage training strategy: First, pre-training on reverse engineering to learn geometric features and design logic. Second, eff ectively extending the model to various downstream tasks such as completion, error correction, and CAD-QA. Consequently, by interpreting B-rep as structural code, BrepCoder achieves superior generalization across diverse tasks, demonstrating its potential as a general-purpose CAD agent.
- Abstract(参考訳): 近年のディープラーニングの進歩はCAD(Computer-Aided Design)領域における複雑な課題に積極的に取り組んできたが、既存のほとんどのアプローチは、新しいタスクに構造的モディフィカチオンを必要とするタスク固有cモデルに依存しており、業界標準境界表現(B-rep)フォーマットではなく、ポイントクラウドやイメージに重点を置いている。
このような制約に対処するため,B-rep入力から多様なCADタスクを実行するMLLM (unifi ed Multimodal Large Language Model) を提案する。
LLM(Large Language Models)のコード生成機能を活用することで,CADモデリングシーケンスをPythonライクなコードに変換し,B-repと整合させる。
まず、幾何学的特徴と設計ロジックを学ぶために、リバースエンジニアリングを事前訓練します。
第二に、effはモデルを、補完、エラー訂正、CAD-QAといった様々な下流タスクに選択的に拡張する。
従って、B-repを構造的コードとして解釈することで、BrepCoderは様々なタスクにまたがる優れた一般化を実現し、汎用CADエージェントとしての可能性を示す。
関連論文リスト
- CME-CAD: Heterogeneous Collaborative Multi-Expert Reinforcement Learning for CAD Code Generation [30.08737988265254]
スケッチから3Dモデルを再構築する既存の方法は、しばしば非編集可能で近似的なモデルを生成する。
本稿では,CADコード生成のための新しい訓練パラダイムであるCME-CAD(Heterogeneous Collaborative Multi-Expert Reinforcement Learning)パラダイムを提案する。
MERL(Multi-Expert Fine-Tuning)とMulti-Expert Reinforcement Learning(MERL)という2段階の学習プロセスを導入する。
論文 参考訳(メタデータ) (2025-12-29T09:37:53Z) - ReCAD: Reinforcement Learning Enhanced Parametric CAD Model Generation with Vision-Language Models [16.220781575918256]
ReCADは、マルチモーダル入力から正確なパラメトリックコンピュータ支援設計(CAD)モデルを生成するために、プレトレーニング済みの大型モデル(PLM)をブートストラップする強化学習(RL)フレームワークである。
我々は階層的な原始的な学習プロセスを用いて、統一報酬関数の下で構造的および構成的スキルを教える。
ReCADは、テキスト・トゥ・CADタスクと画像・トゥ・CADタスクの両方で新しい最先端のタスクを設定し、分布内および分布外設定の幾何学的精度を大幅に改善する。
論文 参考訳(メタデータ) (2025-12-06T07:12:56Z) - BrepGPT: Autoregressive B-rep Generation with Voronoi Half-Patch [61.20046418942948]
境界表現(B-rep)はCADモデル表現のデファクトスタンダードである。
本稿では,B-rep生成のためのシングルステージ自動回帰フレームワークBrepGPTを提案する。
論文 参考訳(メタデータ) (2025-11-27T07:16:53Z) - CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization [16.26305802216836]
CAD-Tokenizerは、プリミティブレベルプーリングと制約付きデコードを備えたシーケンスベースのVQ-VAEを用いて、モダリティ固有のトークンでCADデータを表現している。
この設計はCADの構造的性質に沿ったコンパクトでプリミティブな表現を生成する。
論文 参考訳(メタデータ) (2025-09-25T13:38:36Z) - cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning [55.16668009268005]
3つの入力モードを同時に処理するマルチモーダルCAD再構成モデルを提案する。
大規模プロシージャ生成データに対する教師付き微調整(SFT)と,オンラインフィードバックを用いた強化学習(RL)の2段階パイプラインをプログラム的に取得した。
DeepCADベンチマークでは、SFTモデルは3つの入力モードすべてにおいて既存の単一モードアプローチを同時に上回ります。
論文 参考訳(メタデータ) (2025-05-28T22:32:31Z) - CMT: A Cascade MAR with Topology Predictor for Multimodal Conditional CAD Generation [59.76687657887415]
境界表現(B-Rep)に基づくCAD生成のための最初のマルチモーダルフレームワークであるトポロジ予測器(CMT)を用いたカスケードMARを提案する。
具体的には、カスケードMARは、B-Repsに必須のエッジカウンタ面の先行情報を効果的にキャプチャすることができる。
マルチモーダルアノテーション付きB-Repモデルを含む大規模マルチモーダルCADデータセットmmABCを開発した。
論文 参考訳(メタデータ) (2025-04-29T14:52:28Z) - A Solver-Aided Hierarchical Language for LLM-Driven CAD Design [18.258735692299066]
大規模言語モデル(LLM)は、多種多様な構造的および非構造的生成タスクの解決に成功している。
CAD(Computer Aided Design)における手続き幾何学の創出に苦慮している
本稿では,空間推論要求を幾何学的制約解決器にオフロードするAIDLという,問題解決支援型階層型ドメイン固有言語を提案する。
論文 参考訳(メタデータ) (2025-02-13T23:31:30Z) - Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - CodeRL: Mastering Code Generation through Pretrained Models and Deep
Reinforcement Learning [92.36705236706678]
CodeRLは、事前訓練されたLMと深層強化学習によるプログラム合成タスクのための新しいフレームワークである。
推論中、我々は重要なサンプリング戦略を持つ新しい生成手順を導入する。
モデルバックボーンについては,CodeT5のエンコーダデコーダアーキテクチャを拡張し,学習目標を拡張した。
論文 参考訳(メタデータ) (2022-07-05T02:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。