論文の概要: AutoKG: Constructing Virtual Knowledge Graphs from Unstructured
Documents for Question Answering
- arxiv url: http://arxiv.org/abs/2008.08995v2
- Date: Wed, 10 Mar 2021 20:45:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 03:32:31.529161
- Title: AutoKG: Constructing Virtual Knowledge Graphs from Unstructured
Documents for Question Answering
- Title(参考訳): AutoKG: 質問応答のための構造化されていないドキュメントから仮想知識グラフを構築する
- Authors: Seunghak Yu, Tianxing He, James Glass
- Abstract要約: 構造化されていない文書から知識グラフを自動的に構築する新しいフレームワークを提案する。
まず、構造化されていない文書から知識を抽出し、それらを文脈情報でエンコードする。
同様のコンテキスト意味を持つエンティティは、内部アライメントを通じてリンクされ、グラフ構造を形成する。
これにより、手作業で生成したKGをトラバースすることで、複数の文書から所望の情報を抽出することができる。
- 参考スコア(独自算出の注目度): 19.72815568759182
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge graphs (KGs) have the advantage of providing fine-grained detail
for question-answering systems. Unfortunately, building a reliable KG is
time-consuming and expensive as it requires human intervention. To overcome
this issue, we propose a novel framework to automatically construct a KG from
unstructured documents that does not require external alignment. We first
extract surface-form knowledge tuples from unstructured documents and encode
them with contextual information. Entities with similar context semantics are
then linked through internal alignment to form a graph structure. This allows
us to extract the desired information from multiple documents by traversing the
generated KG without a manual process. We examine its performance in retrieval
based QA systems by reformulating the WikiMovies and MetaQA datasets into a
tuple-level retrieval task. The experimental results show that our method
outperforms traditional retrieval methods by a large margin.
- Abstract(参考訳): 知識グラフ(KG)は、質問応答システムにきめ細かい詳細を提供する利点がある。
残念なことに、信頼できるKGの構築には時間と費用がかかる。
そこで本稿では,外部アライメントを必要としない非構造化文書からKGを自動的に構築するフレームワークを提案する。
まず,非構造化文書から表層的な知識タプルを抽出し,文脈情報でエンコードする。
同様のコンテキスト意味を持つエンティティは、内部アライメントを通してリンクされ、グラフ構造を形成する。
これにより、生成したkgを手動プロセスなしで横断することで、複数の文書から所望の情報を抽出することができる。
WikiMoviesとMetaQAのデータセットをタプルレベルの検索タスクに書き換えることで,検索に基づくQAシステムの性能を評価する。
実験の結果,提案手法は従来の検索手法よりも高い性能を示した。
関連論文リスト
- Ontology-Guided, Hybrid Prompt Learning for Generalization in Knowledge Graph Question Answering [6.232269207752904]
OntoSCPromptは,2段階アーキテクチャを持つ新しい大規模言語モデル(LLM)ベースのKGQAアプローチである。
OntoSCPromptはまず、SPARQLクエリ構造(SELECT、ASK、WHERE、トークン不足のためのプレースホルダーなどのSPARQLキーワードを含む)を生成し、KG固有の情報でそれらを埋める。
両段階で生成されたSPARQLクエリの正しさと実行性を保証するために,タスク固有のデコーディング戦略をいくつか提示する。
論文 参考訳(メタデータ) (2025-02-06T11:47:58Z) - Ontology-grounded Automatic Knowledge Graph Construction by LLM under Wikidata schema [60.42231674887294]
本稿では,Large Language Models (LLMs) を用いた知識グラフ構築のためのオントロジー的アプローチを提案する。
我々は、一貫性と解釈可能性を確保するために、抽出された関係に基づいて、著者によるオントロジーによるKGの基底生成を行う。
我々の研究は、人間の介入を最小限に抑えたスケーラブルなKG建設パイプラインの実現に向けて有望な方向を示し、高品質で人間に解釈可能なKGを生み出す。
論文 参考訳(メタデータ) (2024-12-30T13:36:05Z) - iText2KG: Incremental Knowledge Graphs Construction Using Large Language Models [0.7165255458140439]
iText2KGは、後処理なしで漸進的にトピックに依存しない知識グラフを構築する方法である。
提案手法は,3つのシナリオにまたがるベースライン手法と比較して,優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-05T06:49:14Z) - PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - Text-To-KG Alignment: Comparing Current Methods on Classification Tasks [2.191505742658975]
知識グラフ(KG)は、事実情報の密集した構造化された表現を提供する。
最近の研究は、追加のコンテキストとしてKGから情報を取得するパイプラインモデルの作成に重点を置いている。
現在のメソッドが、アライメントされたサブグラフがクエリに完全に関連しているシナリオとどのように比較されているかは分かっていない。
論文 参考訳(メタデータ) (2023-06-05T13:45:45Z) - A Universal Question-Answering Platform for Knowledge Graphs [7.2676028986202]
我々は,各ターゲットKGに合わせて調整する必要がない汎用QAシステムであるKGQAnを提案する。
KGQAnは、回答の質や処理時間の点で、最先端の大幅なマージンによって容易にデプロイされ、性能が向上する。
論文 参考訳(メタデータ) (2023-03-01T15:35:32Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Query-Specific Knowledge Graphs for Complex Finance Topics [6.599344783327053]
ドメインの専門家が挑戦的な質問を作成できるCODECデータセットに重点を置いています。
最先端のランキングシステムには改善の余地があることが示される。
実体と文書の関連性は正の相関関係にあることを示す。
論文 参考訳(メタデータ) (2022-11-08T10:21:13Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。