論文の概要: Ontology-Based Knowledge Graph Framework for Industrial Standard Documents via Hierarchical and Propositional Structuring
- arxiv url: http://arxiv.org/abs/2512.08398v1
- Date: Tue, 09 Dec 2025 09:26:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.894687
- Title: Ontology-Based Knowledge Graph Framework for Industrial Standard Documents via Hierarchical and Propositional Structuring
- Title(参考訳): 階層的および命題的構造化による産業標準文書のオントロジーに基づく知識グラフフレームワーク
- Authors: Jiin Park, Hyuna Jeon, Yoonseo Lee, Jisu Hong, Misuk Kim,
- Abstract要約: オントロジーに基づく知識グラフ(KG)構築は、ドメイン知識に対する多次元的理解と高度な推論を可能にする中核技術である。
本研究では,このような文書を階層的な意味構造に整理する手法を提案する。
我々の手法は文書の階層構造と論理構造の両方を捉え、ドメイン固有の意味論を効果的に表現する。
- 参考スコア(独自算出の注目度): 8.759087891756069
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ontology-based knowledge graph (KG) construction is a core technology that enables multidimensional understanding and advanced reasoning over domain knowledge. Industrial standards, in particular, contain extensive technical information and complex rules presented in highly structured formats that combine tables, scopes of application, constraints, exceptions, and numerical calculations, making KG construction especially challenging. In this study, we propose a method that organizes such documents into a hierarchical semantic structure, decomposes sentences and tables into atomic propositions derived from conditional and numerical rules, and integrates them into an ontology-knowledge graph through LLM-based triple extraction. Our approach captures both the hierarchical and logical structures of documents, effectively representing domain-specific semantics that conventional methods fail to reflect. To verify its effectiveness, we constructed rule, table, and multi-hop QA datasets, as well as a toxic clause detection dataset, from industrial standards, and implemented an ontology-aware KG-RAG framework for comparative evaluation. Experimental results show that our method achieves significant performance improvements across all QA types compared to existing KG-RAG approaches. This study demonstrates that reliable and scalable knowledge representation is feasible even for industrial documents with intertwined conditions, constraints, and scopes, contributing to future domain-specific RAG development and intelligent document management.
- Abstract(参考訳): オントロジーに基づく知識グラフ(KG)構築は、ドメイン知識に対する多次元的理解と高度な推論を可能にする中核技術である。
特に工業標準には、テーブル、アプリケーションの範囲、制約、例外、数値計算を組み合わせた高度に構造化されたフォーマットで提示される広範な技術情報と複雑なルールが含まれており、KGの構築は特に困難である。
本研究では,このような文書を階層的な意味構造に整理し,文や表を条件や数値規則から派生した原子命題に分解し,LLMに基づく三重抽出によるオントロジー知識グラフに統合する手法を提案する。
提案手法は文書の階層構造と論理構造の両方を捉え,従来の手法では反映できなかったドメイン固有の意味論を効果的に表現する。
その有効性を検証するため,産業標準からルール,テーブル,マルチホップQAデータセット,有毒な条項検出データセットを構築し,比較評価のためのオントロジー対応KG-RAGフレームワークを実装した。
実験結果から,既存のKG-RAG手法と比較して,全てのQA型に対して高い性能向上が得られた。
本研究は,産業用文書の相互運用条件,制約,スコープにおいても,信頼性が高くスケーラブルな知識表現が実現可能であることを示し,今後のドメイン固有のRAG開発やインテリジェントドキュメント管理に寄与することを示す。
関連論文リスト
- Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - Domain-Specific Data Generation Framework for RAG Adaptation [58.20906914537952]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文 参考訳(メタデータ) (2025-10-13T09:59:49Z) - Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching [61.824094419641575]
大言語モデル(LLM)は知識グラフ質問応答(KGQA)のような知識集約的なシナリオにおける幻覚と事実的誤りに苦しむ
これは、構造化知識グラフ(KG)と非構造化クエリのセマンティックギャップによるもので、その焦点や構造に固有の違いが原因である。
既存の手法は通常、バニラKGの資源集約的で非スケーリング可能な推論を用いるが、このギャップを見落としている。
我々は、LLMの事前知識を活用してKGを充実させる柔軟なフレームワークEnrich-on-Graph(EoG)を提案し、グラフとクエリ間のセマンティックギャップを埋める。
論文 参考訳(メタデータ) (2025-09-25T06:48:52Z) - Context-Aware Hierarchical Taxonomy Generation for Scientific Papers via LLM-Guided Multi-Aspect Clustering [59.54662810933882]
既存の分類体系の構築手法は、教師なしクラスタリングや大きな言語モデルの直接的プロンプトを利用しており、コヒーレンスと粒度の欠如が多かった。
LLM誘導型マルチアスペクト符号化と動的クラスタリングを統合したコンテキスト対応階層型階層型分類生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-23T15:12:58Z) - LKD-KGC: Domain-Specific KG Construction via LLM-driven Knowledge Dependency Parsing [9.502380540548497]
知識グラフ(KG)は現実世界の実体とそれらの関係を3重に構成し、様々なタスクに対する機械推論を強化する。
大規模言語モデル(LLM)に基づく知識グラフ構築への最近のアプローチは、効率的であることが証明されている。
教師なしドメイン固有KG構築のための新しいフレームワークであるLKD-KGCを提案する。
論文 参考訳(メタデータ) (2025-05-30T03:10:23Z) - Grounding LLM Reasoning with Knowledge Graphs [4.279373869671241]
我々は、知識グラフと推論戦略を統合することで、KGデータにおける推論チェーンのすべてのステップまたは"思想"をアンカーする。
我々は,Chain-of-Thought (CoT), Tree-of-Thought (ToT), Graph-of-Thought (GoT) など,いくつかの推論手法によるエージェント検索と自動検索の両方を評価した。
我々の実験は、このアプローチがベースラインモデルより一貫して優れていることを示した。
論文 参考訳(メタデータ) (2025-02-18T19:20:46Z) - Ontology-grounded Automatic Knowledge Graph Construction by LLM under Wikidata schema [60.42231674887294]
本稿では,Large Language Models (LLMs) を用いた知識グラフ構築のためのオントロジー的アプローチを提案する。
我々は、一貫性と解釈可能性を確保するために、抽出された関係に基づいて、著者によるオントロジーによるKGの基底生成を行う。
我々の研究は、人間の介入を最小限に抑えたスケーラブルなKG建設パイプラインの実現に向けて有望な方向を示し、高品質で人間に解釈可能なKGを生み出す。
論文 参考訳(メタデータ) (2024-12-30T13:36:05Z) - Automated Extraction and Creation of FBS Design Reasoning Knowledge Graphs from Structured Data in Product Catalogues Lacking Contextual Information [0.10840985826142427]
オントロジーに基づく知識グラフ(KG)は,様々な意思決定シナリオにおいて,効果的な知識管理と再利用が望ましい。
KGの自動抽出と生成に関するほとんどの研究は、広範囲な非構造化データセットに基づいている。
本研究は,このギャップに対処するために開発された手法とデジタルワークフローについて報告する。
論文 参考訳(メタデータ) (2024-12-08T09:20:25Z) - Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph [1.7418328181959968]
本研究は,革新的なセマンティッククエリ処理システムを開発することを目的としている。
オーストラリア国立大学のコンピュータサイエンス(CS)研究者による研究成果に関する総合的な情報を得ることができる。
論文 参考訳(メタデータ) (2024-05-24T09:19:45Z) - Query Structure Modeling for Inductive Logical Reasoning Over Knowledge
Graphs [67.043747188954]
KGに対する帰納的論理的推論のための構造モデル付きテキスト符号化フレームワークを提案する。
線形化されたクエリ構造とエンティティを、事前訓練された言語モデルを使ってエンコードして、回答を見つける。
2つの帰納的論理推論データセットと3つの帰納的推論データセットについて実験を行った。
論文 参考訳(メタデータ) (2023-05-23T01:25:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。