論文の概要: Knowledge Graphs as the Missing Data Layer for LLM-Based Industrial Asset Operations
- arxiv url: http://arxiv.org/abs/2605.26874v1
- Date: Tue, 26 May 2026 11:31:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.977031
- Title: Knowledge Graphs as the Missing Data Layer for LLM-Based Industrial Asset Operations
- Title(参考訳): LLMに基づく産業資産運用における不足データ層としての知識グラフ
- Authors: Madhulatha Mandarapu, Sandeep Kunkunuru,
- Abstract要約: LLMをベースとした産業資産運用のエージェントは、フラットなドキュメントストアに対する推論において、限られた精度を示す。
AssetOpsBenchは、CouchDB、YAML、CSVが支援する139の産業保守シナリオにおいて、GPT-4エージェントが65%を達成することを証明している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based agents for industrial asset operations show limited accuracy when reasoning over flat document stores. AssetOpsBench (KDD 2026) establishes that GPT-4 agents achieve 65% on 139 industrial maintenance scenarios backed by CouchDB, YAML, and CSV. It compares LLM orchestration paradigms (Agent-As-Tool vs Plan-Execute) on a fixed data layer; we ask a complementary, orthogonal question: how much does the data model behind the tools affect agent performance? Building on the same scenarios, we introduce a knowledge graph layer (781 nodes, 955 edges, 16 relationship types) and evaluate three architectures: (1) deterministic graph handlers (no LLM) at 99% (137/139); (2) LLM-generated Cypher over the graph at 82-83% with the same GPT-4 model the baseline uses; and (3) the original tool-augmented LLM baseline at 65% (91/139, matching the published KDD 2026 leaderboard ceiling). Our key finding is inverted LLM usage: rather than asking the LLM to reason over raw data, we ask it to generate structured queries from a typed schema. The graph executes deterministically. We additionally contribute 40 graph-native scenarios (multi-hop dependency, vector similarity, PageRank criticality), and evaluate against the expanded HuggingFace AssetOpsBench release (467 scenarios, 6 domains), where deterministic handlers achieve 100% (467/467) with average score 0.848. These results suggest that for structured operational domains, the data layer -- not the LLM orchestration -- is the primary bottleneck, and that knowledge graphs serve as an integration layer between raw industrial data and LLM-based reasoning.
- Abstract(参考訳): LLMをベースとした産業資産運用のエージェントは、フラットなドキュメントストアに対する推論において、限られた精度を示す。
AssetOpsBench (KDD 2026)は、CouchDB、YAML、CSVが支援する139の産業保守シナリオにおいて、GPT-4エージェントが65%を達成することを証明している。
LLMオーケストレーションのパラダイム(Agent-As-Tool vs Plan-Execute)を固定データ層で比較します。
同じシナリオに基づいて、知識グラフ層(781ノード、955エッジ、16の関係型)を導入し、(1)決定論的グラフハンドラ(LLMなし)を99%(137/139)、(2)グラフ上のLCM生成Cypherを82-83%で、同じGPT-4モデルで使用し、(3)ツール強化LLMベースラインを65%(91/139)で評価する。
LLMに生データを推論させるのではなく、型付きスキーマから構造化されたクエリを生成するように求めます。
グラフは決定論的に実行される。
さらに、40のグラフネイティブシナリオ(マルチホップ依存性、ベクトル類似性、PageRank臨界性)をコントリビュートし、平均スコア0.848で決定論的ハンドラが100%(467/467)のHuggingFace AssetOpsBenchリリース(467シナリオ、6ドメイン)に対して評価する。
これらの結果は、構造化された運用ドメインでは、データ層 -- LLMオーケストレーションではなく -- が主要なボトルネックであり、知識グラフが生産業データとLLMベースの推論の統合レイヤとして機能していることを示唆している。
関連論文リスト
- Graph-of-Agents: A Graph-based Framework for Multi-Agent LLM Collaboration [57.23877089929136]
Graph-of-Agents (GoA)はマルチエージェントLLM通信をモデリングするための新しいグラフベースのフレームワークである。
GoAは3つの選択されたエージェントしか使用せず、最近のマルチエージェントLCMベースラインよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-04-18T21:13:03Z) - Evaluating the Use of LLMs for Documentation to Code Traceability [3.076436880934678]
大規模言語モデルは、様々なソフトウェアドキュメンテーションとソースコードの間のトレースリンクを確立することができる。
私たちは2つのオープンソースプロジェクト(Unity CatalogとCrawl4AI)から2つの新しいデータセットを作成します。
その結果、最高の性能のLLMは2つのデータセットで79.4%と80.4%のF1スコアを達成した。
論文 参考訳(メタデータ) (2025-06-19T16:18:53Z) - BizFinBench: A Business-Driven Real-World Financial Benchmark for Evaluating LLMs [7.9458352414205295]
大規模な言語モデルは一般的なタスクでは優れていますが、ロジック重大で精度の高い、財務、法律、医療といった重要な領域での信頼性の評価は依然として難しいままです。
BizFinBenchは、実世界の金融アプリケーションにおけるLSMの評価に特化して設計された最初のベンチマークである。
BizFinBenchは中国語で6,781の注釈付きクエリで構成されており、数値計算、推論、情報抽出、予測認識、知識に基づく質問応答の5つの次元にまたがっている。
論文 参考訳(メタデータ) (2025-05-26T03:23:02Z) - When Do LLMs Help With Node Classification? A Comprehensive Analysis [21.120619437937382]
我々はLarge Language Models (LLMs) を用いたノード分類のための包括的でテストベッドを開発する。
10のホモ親和性データセット、4つのヘテロ親和性データセット、8つのLLMアルゴリズム、8つの古典的ベースライン、3つの学習パラダイムを含む。
その結果,(1) LLMに基づく手法は, 半教師付き環境では従来手法よりも優れているが, 教師付き環境では優位性が低い, という8つの知見が得られた。
論文 参考訳(メタデータ) (2025-02-02T15:56:05Z) - Can Large Language Models Analyze Graphs like Professionals? A Benchmark, Datasets and Models [70.03602551880526]
グラフを処理するために,大規模言語モデル(LLM)のベンチマークであるProGraphを導入する。
その結果,現在のLCMの性能は不満足であり,最高のモデルでは36%の精度しか達成できないことがわかった。
本研究では,6つの広く使用されているグラフライブラリに基づいて,クローリングされたドキュメントと自動生成コードを含むLLM4Graphデータセットを提案する。
論文 参考訳(メタデータ) (2024-09-29T11:38:45Z) - Call Me When Necessary: LLMs can Efficiently and Faithfully Reason over Structured Environments [40.95811668230818]
本稿では,構造化環境に対する効率的な推論を行うために,Reasoning-Path-Editing (Readi)を提案する。
Readiはクエリが与えられた推論パスを生成し、必要なときにのみそのパスを編集する。
3つのKGQAデータセットと2つのTableQAデータセットの実験結果から、Readiの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T14:59:07Z) - Integrating Graphs with Large Language Models: Methods and Prospects [68.37584693537555]
大規模言語モデル (LLMs) が最前線として登場し、様々なアプリケーションにおいて非並列の長所を示している。
LLMとグラフ構造化データを組み合わせることは、非常に興味深いトピックです。
本稿では、そのような統合を2つの主要なカテゴリに分岐する。
論文 参考訳(メタデータ) (2023-10-09T07:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。