Fugu-MT 論文翻訳(概要): OG-RAG: Ontology-Grounded Retrieval-Augmented Generation For Large Language Models

論文の概要: OG-RAG: Ontology-Grounded Retrieval-Augmented Generation For Large Language Models

arxiv url: http://arxiv.org/abs/2412.15235v1
Date: Thu, 12 Dec 2024 01:21:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-30 03:07:49.817927
Title: OG-RAG: Ontology-Grounded Retrieval-Augmented Generation For Large Language Models
Title（参考訳）: OG-RAG:大規模言語モデルのためのオントロジーを取り巻く検索生成
Authors: Kartik Sharma, Peeyush Kumar, Yunqing Li,
Abstract要約: 本稿では,ドメイン固有コンテキストにおけるプロセスのアンカー化による応答向上のためのオントロジー・グラウンド検索生成手法であるOG-RAGを提案する。 OG-RAGは、事実に基づく推論が不可欠である領域に適用される。
参考スコア（独自算出の注目度）: 5.967549123296788
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: This paper presents OG-RAG, an Ontology-Grounded Retrieval Augmented Generation method designed to enhance LLM-generated responses by anchoring retrieval processes in domain-specific ontologies. While LLMs are widely used for tasks like question answering and search, they struggle to adapt to specialized knowledge, such as industrial workflows or knowledge work, without expensive fine-tuning or sub-optimal retrieval methods. Existing retrieval-augmented models, such as RAG, offer improvements but fail to account for structured domain knowledge, leading to suboptimal context generation. Ontologies, which conceptually organize domain knowledge by defining entities and their interrelationships, offer a structured representation to address this gap. OG-RAG constructs a hypergraph representation of domain documents, where each hyperedge encapsulates clusters of factual knowledge grounded using domain-specific ontology. An optimization algorithm then retrieves the minimal set of hyperedges that constructs a precise, conceptually grounded context for the LLM. This method enables efficient retrieval while preserving the complex relationships between entities. OG-RAG applies to domains where fact-based reasoning is essential, particularly in tasks that require workflows or decision-making steps to follow predefined rules and procedures. These include industrial workflows in healthcare, legal, and agricultural sectors, as well as knowledge-driven tasks such as news journalism, investigative research, consulting and more. Our evaluations demonstrate that OG-RAG increases the recall of accurate facts by 55% and improves response correctness by 40% across four different LLMs. Additionally, OG-RAG enables 30% faster attribution of responses to context and boosts fact-based reasoning accuracy by 27% compared to baseline methods.
Abstract（参考訳）: 本稿では,ドメイン固有オントロジーにおける検索プロセスのアンカー化によるLCM生成応答の向上を目的とした,オントロジーを包含した検索型拡張生成手法であるOG-RAGを提案する。 LLMは質問応答や探索などのタスクに広く使われているが、高価な微調整や準最適検索手法を使わずに、産業ワークフローや知識労働といった専門知識に適応するのに苦労している。既存の検索強化モデル、例えばRAGは改善を提供するが、構造化されたドメイン知識を考慮せず、最適でないコンテキストを生成する。エンティティとその相互関係を定義することによってドメイン知識を概念的に整理するオントロジは、このギャップに対処するための構造化された表現を提供する。 OG-RAGはドメイン文書のハイパーグラフ表現を構築し、各ハイパーエッジはドメイン固有のオントロジーを用いて根拠付けられた事実知識のクラスタをカプセル化する。最適化アルゴリズムは、LLMの正確な、概念的に基礎付けられたコンテキストを構成する、最小限のハイパーエッジの集合を検索する。この方法は、エンティティ間の複雑な関係を保ちながら、効率的な検索を可能にする。 OG-RAGは、ファクトベースの推論が不可欠であるドメイン、特に事前に定義されたルールや手順に従うためにワークフローや意思決定ステップを必要とするタスクに適用される。その中には、医療、法律、農業分野の産業ワークフロー、ニュースジャーナリズム、調査研究、コンサルティングなど、知識駆動的なタスクが含まれる。評価の結果,OG-RAGは正確な事実のリコールを55%増加させ,応答精度を4つのLLMで40%向上させることがわかった。さらに、OG-RAGは文脈に対する応答の寄与を30%速くし、ベースライン法に比べて事実に基づく推論の精度を27%向上させる。

関連論文リスト

DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文参考訳（メタデータ） (2025-07-29T17:55:23Z)
Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs [69.10441885629787]
Retrieval-Augmented Generation (RAG) は、外部知識を注入することによって、Large Language Models (LLM) の事実性を高める。逆に、純粋に推論指向のアプローチは、しばしば幻覚的あるいは誤った事実を必要とする。この調査は両鎖を統一的推論-検索の観点から合成する。
論文参考訳（メタデータ） (2025-07-13T03:29:41Z)
SemRAG: Semantic Knowledge-Augmented RAG for Improved Question-Answering [2.4874078867686085]
SemRAGは、ドメイン固有の知識を効率的に統合する拡張Retrieval Augmented Generation(RAG)フレームワークである。セマンティックチャンキングアルゴリズムを用いて、文の埋め込みからコサイン類似性に基づいて文書を分割し、セマンティックコヒーレンスを保存する。検索した情報を知識グラフに構造化することにより、SemRAGはエンティティ間の関係をキャプチャし、検索精度とコンテキスト理解を改善する。
論文参考訳（メタデータ） (2025-07-10T11:56:25Z)
Self-Routing RAG: Binding Selective Retrieval with Knowledge Verbalization [97.72503890388866]
本稿では,選択的検索と知識の言語化を結合する新しいフレームワークであるSelf-Routing RAG(SR-RAG)を提案する。 SR-RAGは、LLMが外部検索と独自のパラメトリック知識の言語化を動的に決定できるようにする。近接探索による動的知識源推定を導入し,知識源決定の精度を向上させる。
論文参考訳（メタデータ） (2025-04-01T17:59:30Z)
Insight-RAG: Enhancing LLMs with Insight-Driven Augmentation [4.390998479503661]
本稿では,インサイトに基づく文書検索のための新しいフレームワークであるInsight-RAGを提案する。 Insight-RAG の初期段階では,従来の検索手法の代わりに LLM を用いて入力クエリとタスクを解析する。従来のRAG手法と同様に、元のクエリを抽出した洞察と統合することにより、最終的なLCMを用いて、文脈的に豊かで正確な応答を生成する。
論文参考訳（メタデータ） (2025-03-31T19:50:27Z)
Enhancing Large Language Models (LLMs) for Telecommunications using Knowledge Graphs and Retrieval-Augmented Generation [52.8352968531863]
大規模言語モデル(LLM)は、汎用自然言語処理タスクにおいて大きな進歩を遂げている。本稿では,知識グラフ(KG)と検索拡張生成(RAG)技術を組み合わせた新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-31T15:58:08Z)
HiRAG: Retrieval-Augmented Generation with Hierarchical Knowledge [38.500133410610495]
グラフベースのRetrieval-Augmented Generation (RAG)法は,大規模言語モデル(LLM)の性能を大幅に向上させた。既存のRAG法は、人間の認知において自然に生ずる階層的知識を適切に利用していない。本稿では階層的知識を利用してRAGシステムの意味的理解と構造的捕捉能力を高める新しいRAG手法、HiRAGを提案する。
論文参考訳（メタデータ） (2025-03-13T08:22:31Z)
StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization [94.31508613367296]
Retrieval-augmented Generation(RAG)は、大規模言語モデル(LLM)を効果的に強化する鍵となる手段である。本稿では,手前のタスクに対して最適な構造型を識別し,元の文書をこの構造化形式に再構成し,その結果に基づいて回答を推測するStructRAGを提案する。実験の結果、StructRAGは最先端のパフォーマンスを実現し、特に挑戦的なシナリオに優れていた。
論文参考訳（メタデータ） (2024-10-11T13:52:44Z)
Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization [7.522493227357079]
大規模言語モデル(LLM)は大規模コーパスで事前訓練されている。 LLMは幻覚、知識の遮断、知識の帰属の欠如に悩まされる。 SMART-SLICはドメイン固有のLLMフレームワークである。
論文参考訳（メタデータ） (2024-10-03T17:40:55Z)
Exploring Language Model Generalization in Low-Resource Extractive QA [57.14068405860034]
ドメインドリフト下でのLarge Language Models (LLM) を用いた抽出質問応答(EQA)について検討する。性能ギャップを実証的に説明するための一連の実験を考案する。
論文参考訳（メタデータ） (2024-09-27T05:06:43Z)
Embodied-RAG: General Non-parametric Embodied Memory for Retrieval and Generation [69.01029651113386]
Embodied-RAGは、非パラメトリックメモリシステムによるエンボディエージェントのモデルを強化するフレームワークである。コアとなるEmbodied-RAGのメモリはセマンティックフォレストとして構成され、言語記述を様々なレベルで詳細に保存する。 Embodied-RAGがRAGをロボット領域に効果的にブリッジし、250以上の説明とナビゲーションクエリをうまく処理できることを実証する。
論文参考訳（メタデータ） (2024-09-26T21:44:11Z)
A RAG Approach for Generating Competency Questions in Ontology Engineering [1.0044270899550196]
LLM(Large Language Models)の出現により、このプロセスの自動化と強化が可能になった。本稿では,LLMを用いてCQの自動生成を行うRAG(Research-augmented Generation)手法を提案する。 2つのドメインエンジニアリングタスクで GPT-4 を用いて実験を行い、ドメインの専門家が構築した地味な CQ と比較する。
論文参考訳（メタデータ） (2024-09-13T13:34:32Z)
MemoRAG: Moving towards Next-Gen RAG Via Memory-Inspired Knowledge Discovery [24.38640001674072]
Retrieval-Augmented Generation (RAG)は、検索ツールを利用して外部データベースにアクセスする。既存のRAGシステムは主に簡単な質問応答タスクに有効である。本稿では,MemoRAGを提案する。
論文参考訳（メタデータ） (2024-09-09T13:20:31Z)
Evaluating ChatGPT on Nuclear Domain-Specific Data [0.0]
本稿では,大規模言語モデル(LLM)であるChatGPTの,高度に専門化された核データ分野におけるQ&Aタスクへの適用について検討する。主な焦点は、キュレートされたテストデータセット上でのChatGPTのパフォーマンスの評価である。 LLMにRAGパイプラインを組み込むことにより, 性能の向上が図られた。
論文参考訳（メタデータ） (2024-08-26T08:17:42Z)
WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs [10.380692079063467]
本稿では,Web検索と知識グラフを統合したWeKnow-RAGを提案する。まず,知識グラフの構造化表現と高次ベクトル検索の柔軟性を組み合わせることで,LLM応答の精度と信頼性を向上させる。提案手法は,情報検索の効率と精度を効果的にバランスさせ,全体の検索プロセスを改善する。
論文参考訳（メタデータ） (2024-08-14T15:19:16Z)
REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering [115.72130322143275]
REAR(Relevance-Aware Retrieval-augmented approach for open-domain Question answering, QA) 我々は,特殊な設計のアセスメントモジュールを組み込むことで,LLMベースのRAGシステムのための新しいアーキテクチャを開発する。オープンドメインの4つのQAタスクの実験では、REARは以前の競争力のあるRAGアプローチよりも大幅に優れていた。
論文参考訳（メタデータ） (2024-02-27T13:22:51Z)
Knowledge Plugins: Enhancing Large Language Models for Domain-Specific Recommendations [50.81844184210381]
本稿では,大規模言語モデルをDOmain固有のKnowledgEで拡張し,実践的アプリケーション,すなわちDOKEの性能を向上させるためのパラダイムを提案する。このパラダイムはドメイン知識抽出器に依存し,1)タスクに効果的な知識を準備すること,2)特定のサンプルごとに知識を選択すること,3)LLMで理解可能な方法で知識を表現すること,の3つのステップで動作する。
論文参考訳（メタデータ） (2023-11-16T07:09:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。