論文の概要: FlowExtract: Procedural Knowledge Extraction from Maintenance Flowcharts
- arxiv url: http://arxiv.org/abs/2604.06770v1
- Date: Wed, 08 Apr 2026 07:38:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.402122
- Title: FlowExtract: Procedural Knowledge Extraction from Maintenance Flowcharts
- Title(参考訳): FlowExtract:メンテナンスフローチャートからの手続き的知識抽出
- Authors: Guillermo Gil de Avalle, Laura Maruster, Eric Sloot, Christos Emmanouilidis,
- Abstract要約: 本稿では,ISO 5807標準化フローチャートから有向グラフを抽出するパイプラインであるFlowExtractを提案する。
このシステムは、YOLOv8とEasyOCRを使用して接続再構築から要素検出を分離する。
FlowExtractは非常に高いノード検出を実現し、エッジ抽出に基づく視覚言語モデルベースラインを大幅に上回る。
- 参考スコア(独自算出の注目度): 0.9566312408744931
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Maintenance procedures in manufacturing facilities are often documented as flowcharts in static PDFs or scanned images. They encode procedural knowledge essential for asset lifecycle management, yet inaccessible to modern operator support systems. Vision-language models, the dominant paradigm for image understanding, struggle to reconstruct connection topology from such diagrams. We present FlowExtract, a pipeline for extracting directed graphs from ISO 5807-standardized flowcharts. The system separates element detection from connectivity reconstruction, using YOLOv8 and EasyOCR for standard domain-aligned node detection and text extraction, combined with a novel edge detection method that analyzes arrowhead orientations and traces connecting lines backward to source nodes. Evaluated on industrial troubleshooting guides, FlowExtract achieves very high node detection and substantially outperforms vision-language model baselines on edge extraction, offering organizations a practical path toward queryable procedural knowledge representations. The implementation is available athttps://github.com/guille-gil/FlowExtract.
- Abstract(参考訳): 製造設備の保守手順は、しばしば静的PDFやスキャンされた画像のフローチャートとして記録される。
彼らは資産ライフサイクル管理に不可欠な手続き的知識を符号化するが、現代の運用支援システムにはアクセスできない。
画像理解の主要なパラダイムである視覚言語モデルは、そのような図から接続トポロジーを再構築するのに苦労する。
本稿では,ISO 5807標準化フローチャートから有向グラフを抽出するパイプラインであるFlowExtractを提案する。
このシステムは、標準ドメイン整列ノード検出とテキスト抽出にYOLOv8とEasyOCRを用いて接続再構成から要素検出を分離し、矢印方向を解析し、ソースノードに後方に接続する線をトレースする新しいエッジ検出手法と組み合わせた。
産業的トラブルシューティングガイドに基づいて、FlowExtractは非常に高いノード検出を実現し、エッジ抽出の視覚言語モデルベースラインを大幅に上回る。
実装はhttps://github.com/guille-gil/FlowExtract.comで公開されている。
関連論文リスト
- Guideline2Graph: Profile-Aware Multimodal Parsing for Executable Clinical Decision Graphs [3.459382629188014]
完全ガイドラインの証拠を実行可能な臨床判定グラフに変換する分解第一パイプラインを提案する。
我々は,一致する入力と基礎となるVLMバックボーンを併用した適応型前立腺ガイドリンベンチマークで評価を行った。
論文 参考訳(メタデータ) (2026-04-02T19:21:31Z) - Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents [106.04963073116468]
フローチャートは意思決定プロセスを視覚化するための重要なツールです。
視覚言語モデルは、これらの図を分析する際に、存在しない接続や決定経路を幻覚させる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャートについて紹介する。
本稿では, グラフベースの推論により微細なホック帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
論文 参考訳(メタデータ) (2025-06-02T06:02:41Z) - Arrow-Guided VLM: Enhancing Flowchart Understanding via Arrow Direction Encoding [0.0]
フローチャートは、ソフトウェア設計とビジネスプロセス分析に欠かせないツールである。
現在の視覚言語モデル(VLM)は、方向矢印やグラフトポロジーをしばしば誤解している。
より広い3つのプロセスにグループ化された7段階のパイプラインを導入します。
論文 参考訳(メタデータ) (2025-05-09T04:27:36Z) - PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。
本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。
本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2025-04-09T14:58:21Z) - FlowLearn: Evaluating Large Vision-Language Models on Flowchart Understanding [52.35520385083425]
FlowLearnデータセットは、フローチャートの理解を強化するために設計されたリソースである。
科学的サブセットは、科学文献から得られた3,858のフローチャートを含んでいる。
シミュレーションされたサブセットには、カスタマイズ可能なスクリプトを使用して作成された10,000のフローチャートが含まれている。
論文 参考訳(メタデータ) (2024-07-06T20:58:51Z) - BOURNE: Bootstrapped Self-supervised Learning Framework for Unified
Graph Anomaly Detection [50.26074811655596]
自己指導型自己学習(BOURNE)に基づく新しい統合グラフ異常検出フレームワークを提案する。
ノードとエッジ間のコンテキスト埋め込みを交換することで、ノードとエッジの異常を相互に検出できる。
BOURNEは、負のサンプリングを必要としないため、大きなグラフを扱う際の効率を高めることができる。
論文 参考訳(メタデータ) (2023-07-28T00:44:57Z) - SelfDocSeg: A Self-Supervised vision-based Approach towards Document
Segmentation [15.953725529361874]
文書レイアウト分析は文書研究コミュニティにとって既知の問題である。
個人生活へのインターネット接続が拡大するにつれ、パブリックドメインでは膨大な量のドキュメントが利用できるようになった。
我々は,この課題に自己監督型文書セグメンテーションアプローチと異なり,自己監督型文書セグメンテーションアプローチを用いて対処する。
論文 参考訳(メタデータ) (2023-05-01T12:47:55Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Attentional Graph Neural Network for Parking-slot Detection [10.095984750382478]
本論文では,周辺画像におけるマーキングポイントをグラフ構造データとして参照する注目グラフニューラルネットワークに基づくパーキングスロット検出手法を提案する。
手動で設計した後処理がなければ、提案手法はエンドツーエンドのトレーニングが可能である。
公開ベンチマークデータセットでは,提案手法が最先端精度を達成する実験が行われている。
論文 参考訳(メタデータ) (2021-04-06T15:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。