Fugu-MT 論文翻訳(概要): Context-Aware Mapping of 2D Drawing Annotations to 3D CAD Features Using LLM-Assisted Reasoning for Manufacturing Automation

論文の概要: Context-Aware Mapping of 2D Drawing Annotations to 3D CAD Features Using LLM-Assisted Reasoning for Manufacturing Automation

arxiv url: http://arxiv.org/abs/2602.18296v2
Date: Tue, 24 Feb 2026 14:55:20 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 13:30:08.540579
Title: Context-Aware Mapping of 2D Drawing Annotations to 3D CAD Features Using LLM-Assisted Reasoning for Manufacturing Automation
Title（参考訳）: LLM-Assisted Reasoning を用いた3次元CAD特徴量への2次元描画アノテーションの文脈対応マッピング
Authors: Muhammad Tayyab Khan, Lequn Chen, Wenhe Feng, Seung Ki Moon,
Abstract要約: 本稿では、2D描画エンティティを3DCAD機能にマッピングする決定論的第一の文脈認識フレームワークを提案する。 20個のCAD描画ペアの実験では平均精度は83.67%、リコールは90.46%、F1スコアは86.29%である。
参考スコア（独自算出の注目度）: 0.05090720572281118
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Manufacturing automation in process planning, inspection planning, and digital-thread integration depends on a unified specification that binds the geometric features of a 3D CAD model to the geometric dimensioning and tolerancing (GD&T) callouts, datum definitions, and surface requirements carried by the corresponding 2D engineering drawing. Although Model-Based Definition (MBD) allows such specifications to be embedded directly in 3D models, 2D drawings remain the primary carrier of manufacturing intent in automotive, aerospace, shipbuilding, and heavy-machinery industries. Correctly linking drawing annotations to the corresponding 3D features is difficult because of contextual ambiguity, repeated feature patterns, and the need for transparent and traceable decisions. This paper presents a deterministic-first, context-aware framework that maps 2D drawing entities to 3D CAD features to produce a unified manufacturing specification. Drawing callouts are first semantically enriched and then scored against candidate features using an interpretable metric that combines type compatibility, tolerance-aware dimensional agreement, and conservative context consistency, along with engineering-domain heuristics. When deterministic scoring cannot resolve an ambiguity, the system escalates to multimodal and constrained large-language-model reasoning, followed by a single human-in-the-loop (HITL) review step. Experiments on 20 real CAD-drawing pairs achieve a mean precision of 83.67%, recall of 90.46%, and F1 score of 86.29%. An ablation study shows that each pipeline component contributes to overall accuracy, with the full system outperforming all reduced variants. By prioritizing deterministic rules, clear decision tracking, and retaining unresolved cases for human review, the framework provides a practical foundation for downstream manufacturing automation in real-world industrial environments.
Abstract（参考訳）: プロセス計画、検査計画、デジタルスレッド統合における自動化の自動化は、3DCADモデルの幾何学的特徴を幾何学的ディメンテーション・トレランス(GD&T)コールアウト、ダタム定義、および対応する2Dエンジニアリング図面に結合する統一仕様に依存している。モデルベース定義(MBD)は、そのような仕様を3Dモデルに直接組み込むことを可能にするが、2D図面は、自動車、航空宇宙、造船、重機産業における製造意図の主要なキャリアである。図面アノテーションを対応する3D機能に正しくリンクすることは、コンテキストの曖昧さ、反復的な特徴パターン、透明でトレーサブルな決定の必要性のために困難である。本稿では、2次元描画エンティティを3次元CAD特徴にマッピングし、一貫した製造仕様を作成する決定論的一貫したコンテキスト認識フレームワークを提案する。描画コールアウトは、まずセマンティックにリッチ化され、次に、エンジニアリングドメインのヒューリスティックとともに、型互換性、許容-認識-次元整合、保守的コンテキスト整合を組み合わせた解釈可能なメトリックを使用して、候補機能に対してスコアされる。決定論的スコアリングが曖昧さを解決できない場合、システムはマルチモーダルおよび制約付き大言語モデル推論にエスカレートし、続いて1つのHuman-in-the-loop(HITL)レビューステップを行う。 20個のCAD描画ペアの実験では平均精度は83.67%、リコールは90.46%、F1スコアは86.29%である。アブレーション調査では、各パイプラインコンポーネントが全体的な正確性に寄与し、完全なシステムがすべての削減されたバリエーションを上回ることが示されている。決定論的ルールの優先順位付け、明確な意思決定の追跡、そして人間のレビューのための未解決事例の維持により、このフレームワークは現実世界の工業環境における下流製造業の自動化のための実践的な基盤を提供する。

関連論文リスト

Task-Aware 3D Affordance Segmentation via 2D Guidance and Geometric Refinement [12.260126771415019]
タスク対応型3次元シーンアフォーダンスセグメンテーション(TASA)について紹介する。 TASAは2次元のセマンティックキューと3次元の幾何学的推論を粗い方法で併用する新しい幾何学最適化フレームワークである。 3次元幾何情報を完全に活用するために、局所的な3次元幾何と2次元セマンティック先行情報を統合するために、3次元アベイランス改良モジュールを提案する。
論文参考訳（メタデータ） (2025-11-12T13:36:37Z)
3D Software Synthesis Guided by Constraint-Expressive Intermediate Representation [50.70705695129453]
本稿では,要求に敏感な3Dソフトウェア合成手法であるScenethesisを提案する。 Scenethesisは、ユーザ仕様と生成された3Dソフトウェアの間の形式的なトレーサビリティを維持している。 Scenethesisは、最先端の手法と比較して、BLIP-2視覚評価スコアが42.8%向上した。
論文参考訳（メタデータ） (2025-07-24T17:58:03Z)
E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.1674905950243]
3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。 GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文参考訳（メタデータ） (2025-06-02T17:53:09Z)
CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.342222156939403]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。われわれはTriView2CADをリリースした。
論文参考訳（メタデータ） (2025-05-31T13:52:56Z)
PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.681829043446044]
ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。 PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文参考訳（メタデータ） (2025-03-23T17:24:32Z)
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs [15.505120320280007]
本研究では,空間推論強化MLLMを用いたCAD合成法CAD-GPTを紹介する。空間展開機構を用いて3次元空間位置と3次元スケッチ平面回転角を1次元言語特徴空間にマッピングする。また、2Dスケッチ座標を適切な平面空間に識別し、空間開始位置、スケッチ方向、および2Dスケッチ座標変換の正確な決定を可能にする。
論文参考訳（メタデータ） (2024-12-27T14:19:36Z)
GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。 GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文参考訳（メタデータ） (2024-12-12T17:59:03Z)
Articulate3D: Holistic Understanding of 3D Scenes as Universal Scene Description [56.69740649781989]
3Dシーン理解は、コンピュータビジョンにおける長年の課題であり、混合現実、ウェアラブルコンピューティング、そして具体化されたAIを実現する上で重要な要素である。室内280のシーンに高品質な手動アノテーションを付加した専門的な3DデータセットであるArticulate3Dを紹介する。我々はまた,部分分割を同時に予測できる新しい統一フレームワークUSDNetと,オブジェクトの動作属性の完全な仕様を提示する。
論文参考訳（メタデータ） (2024-12-02T11:33:55Z)
Img2CAD: Reverse Engineering 3D CAD Models from Images through VLM-Assisted Conditional Factorization [29.177153478213366]
画像からのリバースエンジニアリング3Dコンピュータ支援設計(CAD)モデルは、多くのダウンストリームアプリケーションにとって重要な課題である。本研究では,タスクを2つのサブプロブレムに条件付き分解する手法を提案する。本稿では,個別構造にセマンティクスを組み込んだTrAssemblerを提案し,連続的な属性値を予測する。
論文参考訳（メタデータ） (2024-07-19T06:53:30Z)
Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文参考訳（メタデータ） (2022-04-02T03:48:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。