論文の概要: Component Segmentation of Engineering Drawings Using Graph Convolutional
Networks
- arxiv url: http://arxiv.org/abs/2212.00290v1
- Date: Thu, 1 Dec 2022 05:31:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 15:09:59.879888
- Title: Component Segmentation of Engineering Drawings Using Graph Convolutional
Networks
- Title(参考訳): グラフ畳み込みネットワークを用いた工学図の部品分割
- Authors: Wentai Zhang, Joe Joseph, Yue Yin, Liuyue Xie, Tomotake Furuhata, Soji
Yamakawa, Kenji Shimada, Levent Burak Kara
- Abstract要約: 本稿では2次元工学的部分描画のベクトル化と機械解釈を自動化するためのデータ駆動型フレームワークを提案する。
これらの課題を克服するために,各ベクトル化コンポーネントの意味型を予測するディープラーニングベースのフレームワークを提案する。
その結果,本手法は最近の画像とグラフベースセグメンテーション法に比較して,最高の性能を示すことがわかった。
- 参考スコア(独自算出の注目度): 0.8941624592392744
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a data-driven framework to automate the vectorization and machine
interpretation of 2D engineering part drawings. In industrial settings, most
manufacturing engineers still rely on manual reads to identify the topological
and manufacturing requirements from drawings submitted by designers. The
interpretation process is laborious and time-consuming, which severely inhibits
the efficiency of part quotation and manufacturing tasks. While recent advances
in image-based computer vision methods have demonstrated great potential in
interpreting natural images through semantic segmentation approaches, the
application of such methods in parsing engineering technical drawings into
semantically accurate components remains a significant challenge. The severe
pixel sparsity in engineering drawings also restricts the effective
featurization of image-based data-driven methods. To overcome these challenges,
we propose a deep learning based framework that predicts the semantic type of
each vectorized component. Taking a raster image as input, we vectorize all
components through thinning, stroke tracing, and cubic bezier fitting. Then a
graph of such components is generated based on the connectivity between the
components. Finally, a graph convolutional neural network is trained on this
graph data to identify the semantic type of each component. We test our
framework in the context of semantic segmentation of text, dimension and,
contour components in engineering drawings. Results show that our method yields
the best performance compared to recent image, and graph-based segmentation
methods.
- Abstract(参考訳): 2次元工学部図のベクトル化と機械解釈を自動化するためのデータ駆動フレームワークを提案する。
工業環境では、ほとんどの製造技術者は、設計者が提出した図面からトポロジカルおよび製造要求を特定するために、手書きの読み取りに依存している。
解釈プロセスは手間と時間がかかるため、部品の引用や製造作業の効率を著しく阻害する。
画像に基づくコンピュータビジョン手法の最近の進歩は、セマンティックセグメンテーションアプローチによる自然画像の解釈に大きな可能性を示しているが、技術図面を意味的に正確なコンポーネントに解析する手法の適用は、依然として大きな課題である。
エンジニアリング図面における重度のピクセル間隔は、画像ベースのデータ駆動手法の効果的な成果化を制限している。
これらの課題を克服するために,各ベクトル化成分の意味型を予測するディープラーニングフレームワークを提案する。
ラスター画像を入力として、薄型化、ストロークトレーシング、立方体ベジターフィッティングにより全ての成分をベクトル化する。
そして、コンポーネント間の接続に基づいて、そのようなコンポーネントのグラフを生成する。
最後に、このグラフデータに基づいてグラフ畳み込みニューラルネットワークをトレーニングし、各コンポーネントの意味型を特定する。
エンジニアリング図面におけるテキスト,次元,輪郭成分の意味的セグメンテーションの文脈で,我々のフレームワークをテストする。
その結果,本手法は最近の画像とグラフベースセグメンテーション法と比較して,最高の性能を示すことがわかった。
関連論文リスト
- VectorGraphNET: Graph Attention Networks for Accurate Segmentation of Complex Technical Drawings [0.40964539027092917]
本稿では,PDF形式での技術図面からベクトルデータを抽出し,解析する手法を提案する。
提案手法では,PDFファイルをSVGフォーマットに変換し,機能豊富なグラフ表現を生成する。
次に、階層的なラベル定義を持つグラフアテンション変換器を適用し、正確な線レベルセグメンテーションを実現する。
論文 参考訳(メタデータ) (2024-10-02T08:53:20Z) - Systematic review of image segmentation using complex networks [1.3053649021965603]
本稿では,複雑なネットワークを用いた画像分割手法について述べる。
コンピュータビジョンや画像処理の応用において、画像分割は複雑な画像の解析に不可欠である。
論文 参考訳(メタデータ) (2024-01-05T11:14:07Z) - Coarse-to-Fine Contrastive Learning in Image-Text-Graph Space for
Improved Vision-Language Compositionality [50.48859793121308]
対照的に訓練された視覚言語モデルは、視覚と言語表現学習において顕著な進歩を遂げた。
近年の研究では、対象、属性、関係性に対して構成的推論を行う能力に厳しい制限が強調されている。
論文 参考訳(メタデータ) (2023-05-23T08:28:38Z) - I Know What You Draw: Learning Grasp Detection Conditioned on a Few
Freehand Sketches [74.63313641583602]
そこで本研究では,スケッチ画像に関連のある潜在的な把握構成を生成する手法を提案する。
私たちのモデルは、現実世界のアプリケーションで簡単に実装できるエンドツーエンドで訓練され、テストされています。
論文 参考訳(メタデータ) (2022-05-09T04:23:36Z) - Geometric Understanding of Sketches [0.0]
そこで本研究では,システムのスケッチの幾何学的理解を支援する2つの手法について検討する。
最初の研究は、グラフ構造としての2次元線描画の解釈を扱い、また、ロボットによる物理的再構成によってその効果を示す。
2つ目の研究では、3次元幾何学に関する情報に明示的にアクセスすることなく、スケッチベースシステムの3次元幾何学的理解をテストする。
論文 参考訳(メタデータ) (2022-04-13T23:55:51Z) - SGEITL: Scene Graph Enhanced Image-Text Learning for Visual Commonsense
Reasoning [61.57887011165744]
マルチモーダルトランスフォーマーはVisual Commonsense Reasoningのタスクにおいて大きな進歩を遂げた。
視覚的なシーングラフを常識的推論に組み込むためのScene Graph Enhanced Image-Text Learningフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-16T03:16:30Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - Adaptive Graph Representation Learning and Reasoning for Face Parsing [55.086151726427104]
顔解析は、各顔成分にピクセルワイズラベルを推論する。
成分関係は、顔領域の曖昧な画素を識別する重要な手がかりである。
顔面成分の適応的グラフ表現学習と推論を提案する。
論文 参考訳(メタデータ) (2021-01-18T12:17:40Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - A Survey on Deep Learning Methods for Semantic Image Segmentation in
Real-Time [0.0]
ロボット工学や自動運転車など、多くの分野において、セマンティックイメージのセグメンテーションが不可欠である。
診断と治療の成功は、検討中のデータの極めて正確な理解に依存している。
近年のディープラーニングの進歩は、この問題に効果的かつ高精度に対処するためのツールを多数提供してきた。
論文 参考訳(メタデータ) (2020-09-27T20:30:10Z) - Contextual Hourglass Network for Semantic Segmentation of High Resolution Aerial Imagery [5.694721155544124]
本研究では,新しいセマンティックセグメンテーション手法を開発し,それをContextual Hourglass Networkと呼ぶ。
本手法では,予測の堅牢性を向上させるため,新しい時間ガラスモジュールを設計する。
さらに,複数の時間ガラスモジュールを接続することで,エンコーダとデコーダのスタック構造をさらに活用する。
論文 参考訳(メタデータ) (2018-10-30T15:33:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。