論文の概要: OSSR-PID: One-Shot Symbol Recognition in P&ID Sheets using Path Sampling
and GCN
- arxiv url: http://arxiv.org/abs/2109.03849v1
- Date: Wed, 8 Sep 2021 18:05:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 14:17:05.074722
- Title: OSSR-PID: One-Shot Symbol Recognition in P&ID Sheets using Path Sampling
and GCN
- Title(参考訳): OSSR-PID:パスサンプリングとGCNを用いたP&IDシートのワンショットシンボル認識
- Authors: Shubham Paliwal, Monika Sharma and Lovekesh Vig
- Abstract要約: P&ID(Piping and Instrumentation Diagrams)は、いくつかの製造業、石油、ガス企業において広く使われている。
本手法は,画像の輪郭境界に沿って連続的に画素をサンプリングすることによって機能する。
動的グラフ畳み込みニューラルネットワーク(DGCNN)は、与えられたシンボルクラスの1つにグラフを分類するために訓練される。
- 参考スコア(独自算出の注目度): 22.64801480942863
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Piping and Instrumentation Diagrams (P&ID) are ubiquitous in several
manufacturing, oil and gas enterprises for representing engineering schematics
and equipment layout. There is an urgent need to extract and digitize
information from P&IDs without the cost of annotating a varying set of symbols
for each new use case. A robust one-shot learning approach for symbol
recognition i.e., localization followed by classification, would therefore go a
long way towards this goal. Our method works by sampling pixels sequentially
along the different contour boundaries in the image. These sampled points form
paths which are used in the prototypical line diagram to construct a graph that
captures the structure of the contours. Subsequently, the prototypical graphs
are fed into a Dynamic Graph Convolutional Neural Network (DGCNN) which is
trained to classify graphs into one of the given symbol classes. Further, we
append embeddings from a Resnet-34 network which is trained on symbol images
containing sampled points to make the classification network more robust.
Since, many symbols in P&ID are structurally very similar to each other, we
utilize Arcface loss during DGCNN training which helps in maximizing symbol
class separability by producing highly discriminative embeddings. The images
consist of components attached on the pipeline (straight line). The sampled
points segregated around the symbol regions are used for the classification
task. The proposed pipeline, named OSSR-PID, is fast and gives outstanding
performance for recognition of symbols on a synthetic dataset of 100 P&ID
diagrams. We also compare our method against prior-work on a real-world private
dataset of 12 P&ID sheets and obtain comparable/superior results. Remarkably,
it is able to achieve such excellent performance using only one prototypical
example per symbol.
- Abstract(参考訳): P&ID (Piping and Instrumentation Diagrams) は、いくつかの製造業、石油、ガス企業において、設計図や機器のレイアウトを表すために広く使われている。
新たなユースケースごとにさまざまなシンボルセットをアノテートするコストを必要とせずに、p&idから情報を抽出してデジタル化する緊急の要求がある。
シンボル認識のための堅牢なワンショット学習アプローチ、すなわち、ローカライゼーションと分類が続くと、この目標に向かって長い道のりが進む。
本手法は,画像の輪郭境界に沿って連続的に画素をサンプリングする。
これらのサンプリングされた点は、原型線図で使われる経路を形成し、輪郭の構造を捉えるグラフを構成する。
その後、原型グラフは動的グラフ畳み込みニューラルネットワーク(DGCNN)に入力され、グラフを与えられたシンボルクラスの1つに分類するように訓練される。
さらに,サンプル点を含むシンボル画像に基づいてトレーニングしたResnet-34ネットワークからの埋め込みを付加することで,分類ネットワークをより堅牢にする。
P&IDの多くのシンボルは構造的に非常によく似ているため、DGCNNトレーニング中にArcface損失を利用して、高度に識別可能な埋め込みを生成することで、シンボルクラス分離性を最大化する。
画像はパイプライン(直線)に取り付けられたコンポーネントで構成される。
シンボル領域の周りに分離されたサンプル点を分類タスクに使用する。
提案したパイプラインはOSSR-PIDと呼ばれ、100のP&IDダイアグラムの合成データセット上でシンボルの認識に優れた性能を提供する。
また,12枚のP&IDシートからなる実世界のプライベートデータセットの事前処理との比較を行い,比較・比較結果を得た。
驚くべきことに、シンボルごとに1つの原型的な例だけで、このような優れたパフォーマンスを達成できます。
関連論文リスト
- Symbol as Points: Panoptic Symbol Spotting via Point-based
Representation [18.61469313164712]
本研究は,コンピュータ支援設計(CAD)図面におけるパノプティカルシンボルスポッティングの問題について考察する。
我々は、グラフィックプリミティブを局所的に連結された2D点の集合として扱う別のアプローチをとる。
具体的には、点変換器を用いて原始的な特徴を抽出し、マスク2フォルマーのようなスポッティングヘッドを付加して最終的な出力を予測する。
論文 参考訳(メタデータ) (2024-01-19T08:44:52Z) - Multi-View Graph Representation Learning Beyond Homophily [2.601278669926709]
非教師付きグラフ表現学習(GRL)は,多種多様なグラフ情報をラベル管理なしでタスクに依存しない埋め込みに抽出することを目的としている。
MVGE(Multi-view Graph)と呼ばれる新しいフレームワークを提案し、キーデザインのセットを特定した。
論文 参考訳(メタデータ) (2023-04-15T08:35:49Z) - Semantic Interleaving Global Channel Attention for Multilabel Remote
Sensing Image Classification [6.52523058108343]
マルチラベルリモートセンシング画像分類(MLRSIC)は研究の関心が高まっている。
複数のラベルの共起関係を付加情報として捉えることで、このタスクの性能を向上させることができる。
現在の手法では、特徴表現を形成するためにラベル相関をフル活用していない。
本稿では,MLRSICに対してSIGNA(Semantic Interleaving Global Channel Attention)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-08-04T12:28:04Z) - Offline Text-Independent Writer Identification based on word level data [7.747239584541488]
本稿では,個人の手書き入力語画像に基づいて,文書の著者を識別する新しい手法を提案する。
SIFTアルゴリズムを用いて、様々な抽象化レベルにおいて複数のキーポイントを抽出する。
これらのキーポイントはトレーニングされたCNNネットワークに渡され、畳み込み層に対応する特徴マップを生成する。
論文 参考訳(メタデータ) (2022-02-21T13:32:09Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z) - Inverse Graph Identification: Can We Identify Node Labels Given Graph
Labels? [89.13567439679709]
グラフ識別(GI)は、グラフ学習において長い間研究されており、特定の応用において不可欠である。
本稿では,逆グラフ識別(Inverse Graph Identification, IGI)と呼ばれる新しい問題を定義する。
本稿では,グラフアテンションネットワーク(GAT)を用いたノードレベルのメッセージパッシング処理を,GIのプロトコルの下でシンプルかつ効果的に行う方法を提案する。
論文 参考訳(メタデータ) (2020-07-12T12:06:17Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。