論文の概要: GraphRAG for Engineering Diagrams: ChatP&ID Enables LLM Interaction with P&IDs
- arxiv url: http://arxiv.org/abs/2603.22528v1
- Date: Mon, 23 Mar 2026 19:44:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.173
- Title: GraphRAG for Engineering Diagrams: ChatP&ID Enables LLM Interaction with P&IDs
- Title(参考訳): GraphRAG for Engineering Diagrams: ChatP&ID による P&ID との LLM インタラクションの実現
- Authors: Achmad Anggawirya Alimin, Artur M. Schweidtmann,
- Abstract要約: 大規模言語モデル(LLM)とRAG(Retrieval-Augmented Generation)と知識グラフを組み合わせることで、エンジニアリング図と対話する新たな機会を提供する。
この研究は、P&IDとの基盤的かつ費用対効果の高い自然言語インタラクションを可能にするエージェントフレームワークであるChatP&IDを導入している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) combined with Retrieval-Augmented Generation (RAG) and knowledge graphs offer new opportunities for interacting with engineering diagrams such as Piping and Instrumentation Diagrams (P&IDs). However, directly processing raw images or smart P&ID files with LLMs is often costly, inefficient, and prone to hallucinations. This work introduces ChatP&ID, an agentic framework that enables grounded and cost-effective natural-language interaction with P&IDs using Graph Retrieval-Augmented Generation (GraphRAG), a paradigm we refer to as GraphRAG for engineering diagrams. Smart P&IDs encoded in the DEXPI standard are transformed into structured knowledge graphs, which serve as the basis for graph-based retrieval and reasoning by LLM agents. This approach enables reliable querying of engineering diagrams while significantly reducing computational cost. Benchmarking across commercial LLM APIs (OpenAI, Anthropic) demonstrates that graph-based representations improve accuracy by 18% over raw image inputs and reduce token costs by 85% compared to directly ingesting smart P&ID files. While small open-source models still struggle to interpret knowledge graph formats and structured engineering data, integrating them with VectorRAG and PathRAG improves response accuracy by up to 40%. Notably, GPT-5-mini combined with ContextRAG achieves 91% accuracy at a cost of only $0.004 per task. The resulting ChatP&ID interface enables intuitive natural-language interaction with complex engineering diagrams and lays the groundwork for AI-assisted process engineering tasks such as Hazard and Operability Studies (HAZOP) and multi-agent analysis.
- Abstract(参考訳): LLM(Large Language Models)とRAG(Retrieval-Augmented Generation)と知識グラフを組み合わせることで、P&ID(Piping and Instrumentation Diagram)のようなエンジニアリング図と対話する新たな機会を提供する。
しかし、生画像やスマートP&IDファイルをLSMで直接処理することは、しばしばコストがかかり、効率が悪く、幻覚を起こす傾向にある。
この研究は、GraphRAG(Graph Retrieval-Augmented Generation)を用いてP&IDとの基盤的かつ費用対効果の高い自然言語インタラクションを可能にするエージェントフレームワークであるChatP&IDを紹介した。
DEXPI標準で符号化されたスマートP&IDは構造化知識グラフに変換され、LLMエージェントによるグラフベースの検索と推論の基礎となる。
このアプローチは、計算コストを大幅に削減しつつ、エンジニアリングダイアグラムの信頼性の高いクエリを可能にする。
商用LLM API(OpenAI, Anthropic)のベンチマークでは、グラフベースの表現は、生画像入力よりも精度を18%向上し、スマートP&IDファイルを直接摂取するよりもトークンコストを85%削減している。
小さなオープンソースモデルは、知識グラフフォーマットや構造化エンジニアリングデータを解釈するのに依然として苦労しているが、VectorRAGやPathRAGと統合することで、応答精度を最大40%向上させる。
特に、GPT-5-miniとContextRAGを組み合わせると、タスク当たり0.004ドルというコストで91%の精度が得られる。
結果として得られるChatP&IDインターフェースは、複雑なエンジニアリングダイアグラムとの直感的な自然言語インタラクションを可能にし、Hazard and Operability Studies(HAZOP)やマルチエージェント分析などのAI支援プロセスエンジニアリングタスクの基盤となる。
関連論文リスト
- GRIP: In-Parameter Graph Reasoning through Fine-Tuning Large Language Models [40.5886835740214]
大規模言語モデル(LLM)は、逐次テキストデータのモデリングにおいて顕著な能力を示した。
グラフから複雑な関係情報を内部化できる新しいフレームワークGRIPを提案する。
この知識は軽量な LoRA パラメータに効率的に格納され、微調整された LLM が幅広いグラフ関連タスクを実行できる。
論文 参考訳(メタデータ) (2025-11-06T21:56:58Z) - G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge [88.82814893945077]
大規模言語モデル(LLM)は複雑な推論において優れているが、静的かつ不完全なパラメトリック知識によって制限される。
最近のグラフ強化RAG (GraphRAG) は、このギャップを補足したグラフを構築し、LLMがそれらを推論できるようにする。
G-reasonerは、様々なグラフ構造化知識を推論するためにグラフと言語基盤モデルを統合した統合フレームワークである。
論文 参考訳(メタデータ) (2025-09-29T04:38:12Z) - Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching [61.824094419641575]
大言語モデル(LLM)は知識グラフ質問応答(KGQA)のような知識集約的なシナリオにおける幻覚と事実的誤りに苦しむ
これは、構造化知識グラフ(KG)と非構造化クエリのセマンティックギャップによるもので、その焦点や構造に固有の違いが原因である。
既存の手法は通常、バニラKGの資源集約的で非スケーリング可能な推論を用いるが、このギャップを見落としている。
我々は、LLMの事前知識を活用してKGを充実させる柔軟なフレームワークEnrich-on-Graph(EoG)を提案し、グラフとクエリ間のセマンティックギャップを埋める。
論文 参考訳(メタデータ) (2025-09-25T06:48:52Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - Graph-R1: Towards Agentic GraphRAG Framework via End-to-end Reinforcement Learning [20.05893083101089]
Graph-R1は、エンドツーエンド強化学習(RL)によるエージェントGraphRAGフレームワークである
軽量な知識ハイパーグラフ構築、マルチターンエージェント環境相互作用としてのモデル検索を導入している。
標準RAGデータセットの実験では、Graph-R1は、精度、検索効率、生成品質を推算する従来のGraphRAGおよびRL強化RAGメソッドよりも優れていた。
論文 参考訳(メタデータ) (2025-07-29T15:01:26Z) - Efficient Knowledge Graph Construction and Retrieval from Unstructured Text for Large-Scale RAG Systems [0.06597195879147556]
企業環境にグラフベースの検索拡張生成(GraphRAG)をデプロイするためのスケーラブルで費用効率のよいフレームワークを提案する。
これらの結果は、現実の大規模エンタープライズアプリケーションにGraphRAGシステムをデプロイできる可能性を検証する。
論文 参考訳(メタデータ) (2025-07-04T00:05:55Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Scalable and Accurate Graph Reasoning with LLM-based Multi-Agents [27.4884498301785]
GraphAgent-Reasonerは、明示的で正確なグラフ推論のための微調整不要なフレームワークである。
分散グラフ計算理論にインスパイアされた我々のフレームワークは、グラフ問題を複数のエージェント間で分散される小さなノード中心のタスクに分解する。
本フレームワークは,Webページ重要度分析などの実世界のグラフ推論アプリケーションを扱う能力を示す。
論文 参考訳(メタデータ) (2024-10-07T15:34:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。