論文の概要: OntoRAG: Enhancing Question-Answering through Automated Ontology Derivation from Unstructured Knowledge Bases
- arxiv url: http://arxiv.org/abs/2506.00664v1
- Date: Sat, 31 May 2025 18:33:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.474453
- Title: OntoRAG: Enhancing Question-Answering through Automated Ontology Derivation from Unstructured Knowledge Bases
- Title(参考訳): OntoRAG:非構造化知識ベースからの自動オントロジー導出による質問応答の促進
- Authors: Yash Tiwari, Owais Ahmad Lone, Mayukha Pal,
- Abstract要約: 本稿では,非構造化知識ベースから導出する自動パイプラインであるOntoRAGを紹介する。
OntoRAGは、Webスクレイピング、PDF解析、ハイブリッドチャンキング、情報抽出、知識グラフ構築、オントロジー生成など、高度な技術を統合している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Ontologies are pivotal for structuring knowledge bases to enhance question answering (QA) systems powered by Large Language Models (LLMs). However, traditional ontology creation relies on manual efforts by domain experts, a process that is time intensive, error prone, and impractical for large, dynamic knowledge domains. This paper introduces OntoRAG, an automated pipeline designed to derive ontologies from unstructured knowledge bases, with a focus on electrical relay documents. OntoRAG integrates advanced techniques, including web scraping, PDF parsing, hybrid chunking, information extraction, knowledge graph construction, and ontology creation, to transform unstructured data into a queryable ontology. By leveraging LLMs and graph based methods, OntoRAG enhances global sensemaking capabilities, outperforming conventional Retrieval Augmented Generation (RAG) and GraphRAG approaches in comprehensiveness and diversity. Experimental results demonstrate OntoRAGs effectiveness, achieving a comprehensiveness win rate of 85% against vector RAG and 75% against GraphRAGs best configuration. This work addresses the critical challenge of automating ontology creation, advancing the vision of the semantic web.
- Abstract(参考訳): オントロジーは、Large Language Models (LLMs) を利用した質問応答(QA)システムを強化するための知識基盤を構築する上で重要である。
しかし、伝統的なオントロジーの作成は、時間集約的でエラーの傾向があり、大規模で動的な知識ドメインにとって非現実的なプロセスである、ドメインの専門家による手作業に依存している。
本稿では,非構造化知識ベースからオントロジーを導出する自動パイプラインであるOntoRAGについて紹介する。
OntoRAGは、Webスクレイピング、PDF解析、ハイブリッドチャンキング、情報抽出、知識グラフ構築、オントロジー生成などの高度な技術を統合し、構造化されていないデータをクエリ可能なオントロジーに変換する。
LLMとグラフベースの手法を活用することで、OntoRAGはグローバルなセンスメイキング能力を強化し、従来の検索拡張生成(RAG)およびグラフRAGアプローチの包括性と多様性に優れる。
OntoRAGの有効性を実証し, ベクトルRAGに対して85%, GraphRAGの最適構成に対して75%の総合的な勝利率を得た。
この研究は、オントロジー作成を自動化するという重要な課題に対処し、セマンティックウェブのビジョンを前進させる。
関連論文リスト
- DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation [4.113142669523488]
ドメイン固有のQAシステムは、生成頻度を必要とするが、構造化専門家の知識に基づく高い事実精度を必要とする。
本稿では,マルチレベル知識グラフ構築と意味ベクトル検索を統合した,スケーラブルでカスタマイズ可能なハイブリッドQAフレームワークであるDO-RAGを提案する。
論文 参考訳(メタデータ) (2025-05-17T06:40:17Z) - RAKG:Document-level Retrieval Augmented Knowledge Graph Construction [10.013667560362565]
本稿では,自動文書レベルの知識グラフ構築の課題に焦点をあてる。
ドキュメントレベルの検索知識グラフ構築(RAKG)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-14T02:47:23Z) - Retrieval-Augmented Generation with Hierarchical Knowledge [38.500133410610495]
グラフベースのRetrieval-Augmented Generation (RAG)法は,大規模言語モデル(LLM)の性能を大幅に向上させた。
既存のRAG法は、人間の認知において自然に生ずる階層的知識を適切に利用していない。
我々は階層的知識を利用してRAGシステムの意味的理解と構造的捕捉能力を高める新しいRAG手法、HiRAGを導入する。
論文 参考訳(メタデータ) (2025-03-13T08:22:31Z) - FastRAG: Retrieval Augmented Generation for Semi-structured Data [1.5566524830295307]
本稿では,半構造化データを対象とした新しいRAG手法であるFastRAGを紹介する。
FastRAGはスキーマ学習とスクリプト学習を使用して、全データソースをLLMに送信することなく、データを抽出し、構造化する。
テキスト検索と知識グラフクエリを統合して、コンテキスト豊富な情報を取得する精度を向上させる。
論文 参考訳(メタデータ) (2024-11-21T01:00:25Z) - StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.31508613367296]
Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。
本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。
実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文 参考訳(メタデータ) (2024-10-11T13:52:44Z) - Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [69.01029651113386]
Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、250以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文 参考訳(メタデータ) (2024-09-26T21:44:11Z) - Graph Retrieval-Augmented Generation: A Survey [28.979898837538958]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の課題に再トレーニングを必要とせずに対処することに成功した。
本稿では,GraphRAGの方法論について概観する。
Graph-Based Indexing、Graph-Guided Retrieval、Graph-Enhanced Generationを含むGraphRAGワークフローを形式化する。
論文 参考訳(メタデータ) (2024-08-15T12:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。