論文の概要: Transforming Engineering Diagrams: A Novel Approach for P&ID Digitization using Transformers
- arxiv url: http://arxiv.org/abs/2411.13929v1
- Date: Thu, 21 Nov 2024 08:27:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-22 15:19:07.439150
- Title: Transforming Engineering Diagrams: A Novel Approach for P&ID Digitization using Transformers
- Title(参考訳): トランスフォーミングエンジニアリングダイアグラム:トランスフォーマーを用いたP&IDディジタイゼーションの新しいアプローチ
- Authors: Jan Marius Stürmer, Marius Graumann, Tobias Koch,
- Abstract要約: 本稿では,最先端のディープラーニングアーキテクチャであるRelationformerを用いて,P&IDからグラフを抽出する手法を提案する。
PID2Graphは,グラフ構造のための包括的ラベルを特徴とするP&IDデータセットである。
実世界のデータに対して、Relationformerは説得力のある結果を達成し、エッジ検出のためのモジュラーデジタル化アプローチを25%以上上回った。
- 参考スコア(独自算出の注目度): 2.5056643038238495
- License:
- Abstract: The digitization of complex technical systems, such as Piping and Instrumentation Diagrams (P&IDs), is crucial for efficient maintenance and operation of complex systems in hydraulic and process engineering. Previous approaches often rely on separate modules that analyze diagram elements individually, neglecting the diagram's overall structure. We address this limitation by proposing a novel approach that utilizes the Relationformer, a state-of-the-art deep learning architecture, to extract graphs from P&IDs. Our method leverages the ability of the Relationformer to simultaneously detect objects and their relationships in images, making it suitable for the task of graph extraction from engineering diagrams. We apply our proposed approach to both real-world and synthetically created P&ID datasets, and evaluate its effectiveness by comparing it with a modular digitization approach based on recent literature. We present PID2Graph, the first publicly accessible P&ID dataset featuring comprehensive labels for the graph structure, including symbols, nodes and their connections that is used for evaluation. To understand the effect of patching and stitching of both of the approaches, we compare values before and after merging the patches. For the real-world data, the Relationformer achieves convincing results, outperforming the modular digitization approach for edge detection by more than 25%. Our work provides a comprehensive framework for assessing the performance of P&ID digitization methods and opens up new avenues for research in this area using transformer architectures. The P&ID dataset used for evaluation will be published and publicly available upon acceptance of the paper.
- Abstract(参考訳): P&ID(Piping and Instrumentation Diagrams)のような複雑な技術システムのデジタル化は、油圧・プロセス工学における複雑なシステムの効率的な保守と運用に不可欠である。
従来のアプローチは、ダイアグラム要素を個別に分析する別々のモジュールに依存しており、ダイアグラム全体の構造を無視していることが多い。
本稿では,最先端のディープラーニングアーキテクチャであるRelationformerを用いて,P&IDからグラフを抽出する手法を提案する。
本手法は,画像中のオブジェクトとその関係を同時に検出するRelationformerの機能を活用し,エンジニアリング図からのグラフ抽出に適している。
提案手法を実世界のP&IDデータセットと合成されたP&IDデータセットの両方に適用し、最近の文献に基づくモジュラーデジタイゼーション手法と比較し、その有効性を評価する。
PID2Graphは、シンボル、ノード、および評価に使用されるそれらの接続を含むグラフ構造のための包括的ラベルを含む、最初の公開アクセス可能なP&IDデータセットである。
両アプローチのパッチと縫合の効果を理解するため,パッチのマージ前後の値を比較した。
実世界のデータに対して、Relationformerは説得力のある結果を達成し、エッジ検出のためのモジュラーデジタル化アプローチを25%以上上回った。
我々の研究は、P&IDデジタル化手法の性能を評価するための包括的なフレームワークを提供し、トランスフォーマーアーキテクチャを用いて、この分野の研究のための新たな道を開く。
評価に用いられるP&IDデータセットは、論文の受理時に公開され公開される。
関連論文リスト
- VectorGraphNET: Graph Attention Networks for Accurate Segmentation of Complex Technical Drawings [0.40964539027092917]
本稿では,PDF形式での技術図面からベクトルデータを抽出し,解析する手法を提案する。
提案手法では,PDFファイルをSVGフォーマットに変換し,機能豊富なグラフ表現を生成する。
次に、階層的なラベル定義を持つグラフアテンション変換器を適用し、正確な線レベルセグメンテーションを実現する。
論文 参考訳(メタデータ) (2024-10-02T08:53:20Z) - SGTR+: End-to-end Scene Graph Generation with Transformer [42.396971149458324]
シーングラフ生成(SGG)は、その構成特性のため、困難な視覚的理解課題である。
これまでのほとんどの作業ではボトムアップ、2段階またはポイントベースの1段階のアプローチを採用していた。
本稿では、上記の問題に対処する新しいSGG法を提案し、そのタスクを二部グラフ構築問題として定式化する。
論文 参考訳(メタデータ) (2024-01-23T15:18:20Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - EPIC: Graph Augmentation with Edit Path Interpolation via Learnable Cost [12.191001329584502]
本稿では,グラフデータセットを新たに拡張するEPIC (Edit Path Interpolation via learnable Cost)を提案する。
不規則な領域にある2つのグラフの間を補間するために、EPICは2つのグラフ間の変換プロセスを表す編集パスを構築する。
我々のアプローチは多くのタスクにおいて既存の拡張テクニックよりも優れています。
論文 参考訳(メタデータ) (2023-06-02T07:19:07Z) - Structured Sentiment Analysis as Transition-based Dependency Parsing [0.40611352512781856]
構造化感情分析は、自然言語のテキストから人の意見を自動的に抽出することを目的としている。
SSAを実行するための最も正確な方法の1つが最近提案され、依存関係解析タスクとしてアプローチされている。
依存関係解析としてSSAに対処する最初の遷移ベース手法を提案する。
論文 参考訳(メタデータ) (2023-05-09T10:03:34Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Digitize-PID: Automatic Digitization of Piping and Instrumentation
Diagrams [21.298283130966148]
Digitize-PIDは、パイプ、シンボル、テキスト情報などのP&IDからコアコンポーネントを検出するエンドツーエンドパイプラインで構成される。
微細な深層認識技術に基づく新規で効率的なカーネルベースライン検出と複素シンボル検出のための2段階法を提案する。
その結果、Digiize-PIDは既存のP&IDデジタル化の最先端よりも優れていた。
論文 参考訳(メタデータ) (2021-09-08T17:32:49Z) - Automated Evolutionary Approach for the Design of Composite Machine
Learning Pipelines [48.7576911714538]
提案手法は、複合機械学習パイプラインの設計を自動化することを目的としている。
パイプラインをカスタマイズ可能なグラフベースの構造で設計し、得られた結果を分析して再生する。
このアプローチのソフトウェア実装は、オープンソースフレームワークとして紹介されている。
論文 参考訳(メタデータ) (2021-06-26T23:19:06Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Recent Developments Combining Ensemble Smoother and Deep Generative
Networks for Facies History Matching [58.720142291102135]
本研究は、ファシズムモデルのための連続パラメータ化を構築するためのオートエンコーダネットワークの利用に焦点を当てる。
本稿では,VAE,GAN,Wasserstein GAN,変分自動符号化GAN,サイクルGANの主成分分析(PCA),転送スタイルネットワークのPCA,スタイル損失のVAEの7種類の定式化をベンチマークする。
論文 参考訳(メタデータ) (2020-05-08T21:32:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。