論文の概要: All Relations Lead to Rome: Automated Knowledge Graph Creation and Question Generation
- arxiv url: http://arxiv.org/abs/2606.22645v1
- Date: Sun, 21 Jun 2026 19:09:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 14:47:27.356187
- Title: All Relations Lead to Rome: Automated Knowledge Graph Creation and Question Generation
- Title(参考訳): ローマへのすべての関係 - 知識グラフ作成と質問生成の自動化
- Authors: Matthijs Jansen op de Haar, Tobias Stähle, Lorenzo Gatti,
- Abstract要約: 自動知識グラフ構築とファクトグラウンドによる質問応答生成のための統合フレームワークであるAll Relations Lead to Rome (ARLtR)を紹介する。
ARLtRは、抽出されたエンティティ、関係性、およびテキスト証拠を支持することを明確にした知識グラフ、埋め込み、質問応答ペアを共同で構築する。
我々は、このフレームワークを、ローマ帝国を中心とした歴史的データセットとしてインスタンス化し、19,000以上のエンティティ、16,000のチャンク、8,400の質問応答ペアからなる。
- 参考スコア(独自算出の注目度): 0.4369550829556578
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models have substantially improved information retrieval and question answering; however, existing datasets generally support either vector-based retrieval over unstructured text or reasoning over knowledge graphs, without providing a unified representation that combines both paradigms. Moreover, current benchmarks rarely provide ground-truth entities, relations, and fact-grounded question-answer pairs aligned with the underlying corpus. To address this gap, we introduce All Relations Lead to Rome (ARLtR), a unified framework for automated knowledge graph construction and fact-grounded question-answer generation. ARLtR jointly constructs a knowledge graph, embeddings, and question-answer pairs that are explicitly grounded in extracted entities, relations, and supporting textual evidence. We further instantiate the framework as a historical dataset centered on the Roman Empire, comprising over 19,000 entities, 16,000 chunks, and 8,400 question-answer pairs (https://huggingface.co/datasets/FaynePro/all-relations-lead-to-rome). By tightly coupling symbolic graph representations with dense retrieval representations, ARLtR facilitates the evaluation and development of hybrid retrieval systems and semantic steering approaches within a single coherent resource.
- Abstract(参考訳): 大規模言語モデルは、情報検索と質問応答を大幅に改善しているが、既存のデータセットは、一般に、構造化されていないテキスト上のベクトルベースの検索か、知識グラフ上の推論のいずれかをサポートし、両方のパラダイムを組み合わせた統一表現を提供しない。
さらに、現在のベンチマークでは、基礎となるコーパスと整合した、基幹的な実体、関係、事実に基づく質問応答ペアはめったに提供されない。
このギャップに対処するために、自動化知識グラフ構築とファクトグラウンドの質問応答生成のための統合フレームワークであるAll Relations Lead to Rome (ARLtR)を紹介する。
ARLtRは、抽出されたエンティティ、関係性、およびテキスト証拠を支持することを明確にした知識グラフ、埋め込み、質問応答ペアを共同で構築する。
さらに19,000以上のエンティティ、16,000のチャンク、8,400の質問応答ペア(https://huggingface.co/datasets/FaynePro/all-relations-lead-to-rome)からなる、ローマ帝国を中心とした歴史的データセットとしてフレームワークをインスタンス化する。
記号グラフ表現と高密度検索表現を密結合することにより、ARLtRは単一のコヒーレントリソース内でのハイブリッド検索システムとセマンティックステアリングアプローチの評価と開発を容易にする。
関連論文リスト
- A Unified Framework for Context-Aware and Relation-Aware Graph Retrieval-Augmented Generation [13.705515718089123]
Retrieval-Augmented Generation (RAG) は、大規模言語モデルを外部知識で拡張するためのパラダイムとして登場した。
既存のグラフベースの手法は、真の知識融合なしに原文に固定された表現を操作する。
本稿では,HyGRAGを提案する。HyGRAGは階層型グラフRAGフレームワークで,3つのコア課題に対処することで,ソース文書を超越する。
論文 参考訳(メタデータ) (2026-06-16T15:44:10Z) - Generative Data Transformation: From Mixed to Unified Data [57.84692191369066]
textscTaesarはtextbftarget-textbfal textbfregenerationのためのEmphdata中心のフレームワークである。
ドメイン間のコンテキストを対象のシーケンスにエンコードすることで、複雑な融合アーキテクチャを使わずに、標準的なモデルで複雑な依存関係を学習することができる。
論文 参考訳(メタデータ) (2026-02-26T08:30:09Z) - Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。
4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-23T05:41:05Z) - RouteRAG: Efficient Retrieval-Augmented Generation from Text and Graph via Reinforcement Learning [69.87510139069218]
Retrieval-Augmented Generation (RAG)は、非パラメトリック知識をLarge Language Models (LLM)に統合する
強化学習(RL)による多ターン推論へのテキストベースRAGの進歩
LLMがマルチターンおよび適応的なグラフテキストハイブリッドRAGを実現するためのRLベースのフレームワークであるモデルを導入する。
論文 参考訳(メタデータ) (2025-12-10T10:05:31Z) - Scalable and Explainable Enterprise Knowledge Discovery Using Graph-Centric Hybrid Retrieval [0.0]
現代の企業は、Jira、Gitリポジトリ、Confluence、wikiなどの異種システムに分散した膨大な知識を管理している。
本稿では,知識ベース言語拡張モデル(KBLam),DeepGraph表現,埋め込み型セマンティック検索を統合したモジュール型ハイブリッド検索フレームワークを提案する。
このフレームワークは、コード、プルリクエスト、コミット履歴を含む解析済みのリポジトリから統一された知識グラフを構築する。
大規模なGitリポジトリの実験では、統一推論層は、スタンドアロンのGPTベースの検索パイプラインと比較して、回答の妥当性を最大80%改善している。
論文 参考訳(メタデータ) (2025-10-13T02:56:36Z) - Relational Deep Learning: Challenges, Foundations and Next-Generation Architectures [50.46688111973999]
グラフ機械学習は、任意のグラフ構造化データで学習するモデルの能力を大幅に向上させた。
従来の工学的特徴を伴わない'関係エンティティグラフ'のエンドツーエンド表現を可能にする新しい青写真を提案する。
本稿では、大規模マルチテーブル統合や、時間力学と異種データのモデリングの複雑さなど、重要な課題について論じる。
論文 参考訳(メタデータ) (2025-06-19T23:51:38Z) - ArchRAG: Attributed Community-based Hierarchical Retrieval-Augmented Generation [16.204046295248546]
Retrieval-Augmented Generation (RAG) は、外部知識を大規模言語モデルに統合するのに有効であることが証明されている。
我々は、Attributed Community-based Hierarchical RAG (ArchRAG)と呼ばれる新しいグラフベースのRAGアプローチを導入する。
属性付きコミュニティのための新しい階層型インデックス構造を構築し,効果的なオンライン検索手法を開発した。
論文 参考訳(メタデータ) (2025-02-14T03:28:36Z) - From Local to Global: A Graph RAG Approach to Query-Focused Summarization [4.075260785658849]
GraphRAGは、プライベートテキストコーパスに対する質問応答のためのグラフベースのアプローチである。
我々は,GraphRAGが従来のRAGベースラインよりも大幅に改善され,生成した回答の包括性と多様性が向上することを示す。
論文 参考訳(メタデータ) (2024-04-24T18:38:11Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Dynamic Hybrid Relation Network for Cross-Domain Context-Dependent
Semantic Parsing [52.24507547010127]
ドメイン間コンテキスト依存のセマンティック解析は研究の新たな焦点である。
本稿では,コンテキストの発話,トークン,データベーススキーマ,会話の進行に伴う複雑なインタラクションを効果的にモデル化する動的グラフフレームワークを提案する。
提案したフレームワークは既存のモデルを大きなマージンで上回り、2つの大規模ベンチマークで新しい最先端性能を達成する。
論文 参考訳(メタデータ) (2021-01-05T18:11:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。