論文の概要: A Large Language Model Powered Integrated Circuit Footprint Geometry Understanding
- arxiv url: http://arxiv.org/abs/2508.03725v1
- Date: Wed, 30 Jul 2025 02:16:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.331562
- Title: A Large Language Model Powered Integrated Circuit Footprint Geometry Understanding
- Title(参考訳): 大規模言語モデルを用いた統合回路足跡形状解析
- Authors: Yida Wang, Taiting Lu, Runze Liu, Lanqing Yang, Yifan Yang, Zhe Chen, Yuehai Wang, Yixin Liu, Kaiyuan Lin, Xiaomeng Chen, Dian Ding, Yijie Li, Yi-Chao Chen, Yincheng Jin, Mahanth Gowda,
- Abstract要約: LLM4-IC8Kは、ICメカニカル描画を画像として扱い、LLMを構造化幾何学的解釈に活用する新しいフレームワークである。
まず、合成したICフットプリント図上でLMMを訓練し、基本的な幾何学的推論を学習する2段階のフレームワークを提案する。
本モデルでは,提案したベンチマークにおいて,最先端のLMMよりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 28.549303184788858
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Printed-Circuit-board (PCB) footprint geometry labeling of integrated circuits (IC) is essential in defining the physical interface between components and the PCB layout, requiring exceptional visual perception proficiency. However, due to the unstructured footprint drawing and abstract diagram annotations, automated parsing and accurate footprint geometry modeling remain highly challenging. Despite its importance, no methods currently exist for automated package geometry labeling directly from IC mechanical drawings. In this paper, we first investigate the visual perception performance of Large Multimodal Models (LMMs) when solving IC footprint geometry understanding. Our findings reveal that current LMMs severely suffer from inaccurate geometric perception, which hinders their performance in solving the footprint geometry labeling problem. To address these limitations, we propose LLM4-IC8K, a novel framework that treats IC mechanical drawings as images and leverages LLMs for structured geometric interpretation. To mimic the step-by-step reasoning approach used by human engineers, LLM4-IC8K addresses three sub-tasks: perceiving the number of pins, computing the center coordinates of each pin, and estimating the dimensions of individual pins. We present a two-stage framework that first trains LMMs on synthetically generated IC footprint diagrams to learn fundamental geometric reasoning and then fine-tunes them on real-world datasheet drawings to enhance robustness and accuracy in practical scenarios. To support this, we introduce ICGeo8K, a multi-modal dataset with 8,608 labeled samples, including 4138 hand-crafted IC footprint samples and 4470 synthetically generated samples. Extensive experiments demonstrate that our model outperforms state-of-the-art LMMs on the proposed benchmark.
- Abstract(参考訳): 集積回路 (IC) のプリント回路 (PCB) 形状のラベル付けは, コンポーネントとPCBレイアウトの物理的インターフェースを定義する上で不可欠であり, 異常な視覚的知覚能力を必要とする。
しかし、構造化されていないフットプリント図と抽象図のアノテーションのため、自動解析と正確なフットプリント形状モデリングは非常に難しいままである。
その重要性にもかかわらず、ICメカニカル・ドローイングから直接パッケージ・ジオメトリをラベル付けする手法は今のところ存在しない。
本稿では,ICフットプリントの幾何学的理解を解く際に,LMM(Large Multimodal Models)の視覚知覚性能について検討する。
その結果,現在のLMMは不正確な幾何学的知覚に苦しめられ,フットプリント幾何学的ラベル付け問題の解決に支障をきたすことが明らかとなった。
これらの制約に対処するため、ICメカニカル描画を画像として扱い、LLMを構造化幾何学的解釈に活用する新しいフレームワーク LLM4-IC8K を提案する。
人間のエンジニアが使用するステップバイステップ推論アプローチを模倣するために、LLM4-IC8Kは、ピンの数を知覚し、各ピンの中心座標を計算し、個々のピンの寸法を推定する3つのサブタスクに対処する。
まず,合成したICフットプリント図上でLMMを訓練し,基本的な幾何学的推論を学習し,実世界のデータシートの描画を微調整し,実用シナリオにおける堅牢性と精度を高めるための2段階のフレームワークを提案する。
8,608個のラベル付きサンプルと4138個の手作りICフットプリントサンプルと4470個の合成サンプルを含むマルチモーダルデータセットであるICGeo8Kを紹介した。
大規模な実験により,提案したベンチマークにおいて,我々のモデルは最先端のLMMよりも優れていることが示された。
関連論文リスト
- CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - MATHGLANCE: Multimodal Large Language Models Do Not Know Where to Look in Mathematical Diagrams [65.02628814094639]
ダイアグラムは視覚言語の基本形として機能し、複雑な概念と、構造化されたシンボル、形状、空間的配置を通してそれらの相互関係を表現する。
現在のベンチマークでは知覚と推論のタスクが明確化されており、マルチモーダルな大規模言語モデルが表面的なパターン認識以上の数学的図形を真に理解しているかどうかを評価することは困難である。
MLLMにおける数学的知覚の分離と評価を目的としたベンチマークであるMATHGLANCEを紹介する。
幾何学的プリミティブと正確な空間関係を付加した200K構造幾何画像テキストの知覚指向データセットであるGeoPePを構築した。
論文 参考訳(メタデータ) (2025-03-26T17:30:41Z) - PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.681829043446044]
ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。
PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文 参考訳(メタデータ) (2025-03-23T17:24:32Z) - Str-L Pose: Integrating Point and Structured Line for Relative Pose Estimation in Dual-Graph [45.115555973941255]
ロボットや自律運転など、さまざまなコンピュータビジョンアプリケーションにおいて、相対的なポーズ推定が不可欠である。
本稿では,余分な構造線セグメントと点特徴を統合した幾何対応グラフニューラルネットワークを提案する。
この整合点と線分の統合は、幾何学的制約をさらに活用し、異なる環境におけるモデル性能を向上させる。
論文 参考訳(メタデータ) (2024-08-28T12:33:26Z) - Computer Vision Model Compression Techniques for Embedded Systems: A Survey [75.38606213726906]
本稿では,コンピュータビジョンタスクに適用される主モデル圧縮技術について述べる。
本稿では,圧縮サブ領域の特性について述べるとともに,異なるアプローチを比較し,最適な手法を選択する方法について論じる。
初期の実装課題を克服する上で、研究者や新しい実践者を支援するためのコードも共有しています。
論文 参考訳(メタデータ) (2024-08-15T16:41:55Z) - Model-to-Circuit Cross-Approximation For Printed Machine Learning
Classifiers [4.865819809855699]
プリントエレクトロニクス(PE)は、オンデマンド製造、低い非再帰エンジニアリングコスト、サブセント製造コストを約束する。
PEにおける大きな特徴サイズは、PEにおける複雑なMLモデルの実現を禁止している。
本稿では,PEにおける複雑なMLモデルを実現するため,自動層間近似フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-14T22:11:34Z) - Semi-Parametric Inducing Point Networks and Neural Processes [15.948270454686197]
半パラメトリック誘導点ネットワーク(SPIN)は、推論時間におけるトレーニングセットを計算効率よくクエリすることができる。
SPINは、ポイントメソッドにインスパイアされたデータポイント間のクロスアテンションメカニズムを通じて、線形複雑性を実現する。
実験では,SPINはメモリ要件を低減し,様々なメタラーニングタスクの精度を向上し,重要な実用的問題である遺伝子型計算における最先端性能を向上させる。
論文 参考訳(メタデータ) (2022-05-24T01:42:46Z) - Vitruvion: A Generative Model of Parametric CAD Sketches [22.65229769427499]
本稿では,パラメトリックCADスケッチの生成モデルを提案する。
我々のモデルは、SketchGraphsデータセットから実世界のデザインを訓練し、スケッチをプリミティブのシーケンスとして自動回帰的に合成する。
我々は、部分スケッチ(プライマー)や手描きスケッチのイメージなど、様々な文脈でモデルを条件付けする。
論文 参考訳(メタデータ) (2021-09-29T01:02:30Z) - Weakly But Deeply Supervised Occlusion-Reasoned Parametric Layouts [87.370534321618]
複雑な道路シーンのRGBイメージをインプットとして単一の視点で捉えたエンドツーエンドのネットワークを提案し、パースペクティブ空間における閉塞性のあるレイアウトを創出する。
私たちのメソッドで必要とされる唯一の人間のアノテーションは、より安価で入手しにくいパラメトリック属性です。
私たちは、KITTIとNuScenesという2つの公開データセットのアプローチを検証し、人間の監督を大幅に低下させることで、最先端の結果を実現します。
論文 参考訳(メタデータ) (2021-04-14T09:32:29Z) - SketchGraphs: A Large-Scale Dataset for Modeling Relational Geometry in
Computer-Aided Design [18.041056084458567]
CAD(Parametric Computer-Aided Design)は、物理設計における機械工学の主要なパラダイムである。
SketchGraphsは、実世界のCADモデルから抽出された1500万のスケッチと、オープンソースのデータ処理パイプラインを組み合わせたコレクションである。
論文 参考訳(メタデータ) (2020-07-16T17:56:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。