論文の概要: OntoRAG: Enhancing Question-Answering through Automated Ontology Derivation from Unstructured Knowledge Bases
- arxiv url: http://arxiv.org/abs/2506.00664v1
- Date: Sat, 31 May 2025 18:33:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.474453
- Title: OntoRAG: Enhancing Question-Answering through Automated Ontology Derivation from Unstructured Knowledge Bases
- Title(参考訳): OntoRAG:非構造化知識ベースからの自動オントロジー導出による質問応答の促進
- Authors: Yash Tiwari, Owais Ahmad Lone, Mayukha Pal,
- Abstract要約: 本稿では,非構造化知識ベースから導出する自動パイプラインであるOntoRAGを紹介する。
OntoRAGは、Webスクレイピング、PDF解析、ハイブリッドチャンキング、情報抽出、知識グラフ構築、オントロジー生成など、高度な技術を統合している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Ontologies are pivotal for structuring knowledge bases to enhance question answering (QA) systems powered by Large Language Models (LLMs). However, traditional ontology creation relies on manual efforts by domain experts, a process that is time intensive, error prone, and impractical for large, dynamic knowledge domains. This paper introduces OntoRAG, an automated pipeline designed to derive ontologies from unstructured knowledge bases, with a focus on electrical relay documents. OntoRAG integrates advanced techniques, including web scraping, PDF parsing, hybrid chunking, information extraction, knowledge graph construction, and ontology creation, to transform unstructured data into a queryable ontology. By leveraging LLMs and graph based methods, OntoRAG enhances global sensemaking capabilities, outperforming conventional Retrieval Augmented Generation (RAG) and GraphRAG approaches in comprehensiveness and diversity. Experimental results demonstrate OntoRAGs effectiveness, achieving a comprehensiveness win rate of 85% against vector RAG and 75% against GraphRAGs best configuration. This work addresses the critical challenge of automating ontology creation, advancing the vision of the semantic web.
- Abstract(参考訳): オントロジーは、Large Language Models (LLMs) を利用した質問応答(QA)システムを強化するための知識基盤を構築する上で重要である。
しかし、伝統的なオントロジーの作成は、時間集約的でエラーの傾向があり、大規模で動的な知識ドメインにとって非現実的なプロセスである、ドメインの専門家による手作業に依存している。
本稿では,非構造化知識ベースからオントロジーを導出する自動パイプラインであるOntoRAGについて紹介する。
OntoRAGは、Webスクレイピング、PDF解析、ハイブリッドチャンキング、情報抽出、知識グラフ構築、オントロジー生成などの高度な技術を統合し、構造化されていないデータをクエリ可能なオントロジーに変換する。
LLMとグラフベースの手法を活用することで、OntoRAGはグローバルなセンスメイキング能力を強化し、従来の検索拡張生成(RAG)およびグラフRAGアプローチの包括性と多様性に優れる。
OntoRAGの有効性を実証し, ベクトルRAGに対して85%, GraphRAGの最適構成に対して75%の総合的な勝利率を得た。
この研究は、オントロジー作成を自動化するという重要な課題に対処し、セマンティックウェブのビジョンを前進させる。
関連論文リスト
- DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation [4.113142669523488]
ドメイン固有のQAシステムは、生成頻度を必要とするが、構造化専門家の知識に基づく高い事実精度を必要とする。
本稿では,マルチレベル知識グラフ構築と意味ベクトル検索を統合した,スケーラブルでカスタマイズ可能なハイブリッドQAフレームワークであるDO-RAGを提案する。
論文 参考訳(メタデータ) (2025-05-17T06:40:17Z) - RAKG:Document-level Retrieval Augmented Knowledge Graph Construction [10.013667560362565]
本稿では,自動文書レベルの知識グラフ構築の課題に焦点をあてる。
ドキュメントレベルの検索知識グラフ構築(RAKG)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-14T02:47:23Z) - Enhancing Large Language Models (LLMs) for Telecommunications using Knowledge Graphs and Retrieval-Augmented Generation [52.8352968531863]
大規模言語モデル(LLM)は、汎用自然言語処理タスクにおいて大きな進歩を遂げている。
本稿では,知識グラフ(KG)と検索拡張生成(RAG)技術を組み合わせた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-31T15:58:08Z) - Retrieval-Augmented Generation with Hierarchical Knowledge [38.500133410610495]
グラフベースのRetrieval-Augmented Generation (RAG)法は,大規模言語モデル(LLM)の性能を大幅に向上させた。
既存のRAG法は、人間の認知において自然に生ずる階層的知識を適切に利用していない。
我々は階層的知識を利用してRAGシステムの意味的理解と構造的捕捉能力を高める新しいRAG手法、HiRAGを導入する。
論文 参考訳(メタデータ) (2025-03-13T08:22:31Z) - ArchRAG: Attributed Community-based Hierarchical Retrieval-Augmented Generation [16.204046295248546]
Retrieval-Augmented Generation (RAG) は、外部知識を大規模言語モデル (LLM) に統合するのに有効であることが証明されている。
我々は、Attributed Community-based Hierarchical RAG (ArchRAG)と呼ばれる新しいグラフベースのRAGアプローチを導入する。
属性付きコミュニティのための新しい階層型インデックス構造を構築し,効果的なオンライン検索手法を開発した。
ArchRAGはHuaweiのクラウドコンピューティングにおけるドメイン知識のQAにうまく適用されている。
論文 参考訳(メタデータ) (2025-02-14T03:28:36Z) - Graph Foundation Models for Recommendation: A Comprehensive Survey [55.70529188101446]
大規模言語モデル(LLM)は自然言語を処理し、理解するために設計されており、どちらも非常に効果的で広く採用されている。
最近の研究はグラフ基礎モデル(GFM)に焦点を当てている。
GFM は GNN と LLM の強みを統合し,複雑な RS 問題をより効率的にモデル化する。
論文 参考訳(メタデータ) (2025-02-12T12:13:51Z) - GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [84.41557981816077]
本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-03T07:04:29Z) - FastRAG: Retrieval Augmented Generation for Semi-structured Data [1.5566524830295307]
本稿では,半構造化データを対象とした新しいRAG手法であるFastRAGを紹介する。
FastRAGはスキーマ学習とスクリプト学習を使用して、全データソースをLLMに送信することなく、データを抽出し、構造化する。
テキスト検索と知識グラフクエリを統合して、コンテキスト豊富な情報を取得する精度を向上させる。
論文 参考訳(メタデータ) (2024-11-21T01:00:25Z) - StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.31508613367296]
Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。
本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。
実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文 参考訳(メタデータ) (2024-10-11T13:52:44Z) - Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [69.01029651113386]
Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。
コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。
Embodied-RAGがRAGをロボット領域に効果的にブリッジし、250以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文 参考訳(メタデータ) (2024-09-26T21:44:11Z) - Graph Retrieval-Augmented Generation: A Survey [28.979898837538958]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の課題に再トレーニングを必要とせずに対処することに成功した。
本稿では,GraphRAGの方法論について概観する。
Graph-Based Indexing、Graph-Guided Retrieval、Graph-Enhanced Generationを含むGraphRAGワークフローを形式化する。
論文 参考訳(メタデータ) (2024-08-15T12:20:24Z) - LasUIE: Unifying Information Extraction with Latent Adaptive
Structure-aware Generative Language Model [96.889634747943]
全ての典型的な情報抽出タスク(UIE)を1つの生成言語モデル(GLM)で普遍的にモデル化し、大きな可能性を明らかにした。
UIE のための構文知識のパワーを完全に解放する構造対応 GLM を提案する。
7つのタスクにわたるIEベンチマークが12以上あり、私たちのシステムはベースラインのUIEシステムよりも大幅に改善されていることを示しています。
論文 参考訳(メタデータ) (2023-04-13T04:01:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。