論文の概要: AutoKG: Constructing Virtual Knowledge Graphs from Unstructured
Documents for Question Answering
- arxiv url: http://arxiv.org/abs/2008.08995v2
- Date: Wed, 10 Mar 2021 20:45:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 03:32:31.529161
- Title: AutoKG: Constructing Virtual Knowledge Graphs from Unstructured
Documents for Question Answering
- Title(参考訳): AutoKG: 質問応答のための構造化されていないドキュメントから仮想知識グラフを構築する
- Authors: Seunghak Yu, Tianxing He, James Glass
- Abstract要約: 構造化されていない文書から知識グラフを自動的に構築する新しいフレームワークを提案する。
まず、構造化されていない文書から知識を抽出し、それらを文脈情報でエンコードする。
同様のコンテキスト意味を持つエンティティは、内部アライメントを通じてリンクされ、グラフ構造を形成する。
これにより、手作業で生成したKGをトラバースすることで、複数の文書から所望の情報を抽出することができる。
- 参考スコア(独自算出の注目度): 19.72815568759182
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge graphs (KGs) have the advantage of providing fine-grained detail
for question-answering systems. Unfortunately, building a reliable KG is
time-consuming and expensive as it requires human intervention. To overcome
this issue, we propose a novel framework to automatically construct a KG from
unstructured documents that does not require external alignment. We first
extract surface-form knowledge tuples from unstructured documents and encode
them with contextual information. Entities with similar context semantics are
then linked through internal alignment to form a graph structure. This allows
us to extract the desired information from multiple documents by traversing the
generated KG without a manual process. We examine its performance in retrieval
based QA systems by reformulating the WikiMovies and MetaQA datasets into a
tuple-level retrieval task. The experimental results show that our method
outperforms traditional retrieval methods by a large margin.
- Abstract(参考訳): 知識グラフ(KG)は、質問応答システムにきめ細かい詳細を提供する利点がある。
残念なことに、信頼できるKGの構築には時間と費用がかかる。
そこで本稿では,外部アライメントを必要としない非構造化文書からKGを自動的に構築するフレームワークを提案する。
まず,非構造化文書から表層的な知識タプルを抽出し,文脈情報でエンコードする。
同様のコンテキスト意味を持つエンティティは、内部アライメントを通してリンクされ、グラフ構造を形成する。
これにより、生成したkgを手動プロセスなしで横断することで、複数の文書から所望の情報を抽出することができる。
WikiMoviesとMetaQAのデータセットをタプルレベルの検索タスクに書き換えることで,検索に基づくQAシステムの性能を評価する。
実験の結果,提案手法は従来の検索手法よりも高い性能を示した。
関連論文リスト
- PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。
本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。
ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文 参考訳(メタデータ) (2023-09-16T04:29:05Z) - Text-To-KG Alignment: Comparing Current Methods on Classification Tasks [2.191505742658975]
知識グラフ(KG)は、事実情報の密集した構造化された表現を提供する。
最近の研究は、追加のコンテキストとしてKGから情報を取得するパイプラインモデルの作成に重点を置いている。
現在のメソッドが、アライメントされたサブグラフがクエリに完全に関連しているシナリオとどのように比較されているかは分かっていない。
論文 参考訳(メタデータ) (2023-06-05T13:45:45Z) - A Universal Question-Answering Platform for Knowledge Graphs [7.2676028986202]
我々は,各ターゲットKGに合わせて調整する必要がない汎用QAシステムであるKGQAnを提案する。
KGQAnは、回答の質や処理時間の点で、最先端の大幅なマージンによって容易にデプロイされ、性能が向上する。
論文 参考訳(メタデータ) (2023-03-01T15:35:32Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Query-Specific Knowledge Graphs for Complex Finance Topics [6.599344783327053]
ドメインの専門家が挑戦的な質問を作成できるCODECデータセットに重点を置いています。
最先端のランキングシステムには改善の余地があることが示される。
実体と文書の関連性は正の相関関係にあることを示す。
論文 参考訳(メタデータ) (2022-11-08T10:21:13Z) - Detect, Retrieve, Comprehend: A Flexible Framework for Zero-Shot
Document-Level Question Answering [6.224211330728391]
研究者は貴重な技術知識を含む何千もの学術文書を作成した。
文書レベルの質問応答(QA)は、人間の提案する質問を適応して多様な知識を抽出できる柔軟なフレームワークを提供する。
本稿では,PDFからテキストを抽出する3段階の文書QAアプローチ,抽出したテキストからエビデンスを抽出して適切な文脈を形成する方法,文脈から知識を抽出して高品質な回答を返すためのQAを提案する。
論文 参考訳(メタデータ) (2022-10-04T23:33:52Z) - Generate rather than Retrieve: Large Language Models are Strong Context
Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。
我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文 参考訳(メタデータ) (2022-09-21T01:30:59Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Improving Conversational Recommendation Systems' Quality with
Context-Aware Item Meta Information [42.88448098873448]
対話レコメンデーションシステム(CRS)は,対話履歴からユーザの好みを推測することでユーザと対話する。
従来のCRSでは、知識グラフ(KG)ベースのレコメンデーションモジュールを使用し、応答生成のための言語モデルとKGを統合する。
本稿では,事前学習言語モデル(PLM)と項目メタデータエンコーダを組み合わせた,シンプルで効果的なアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-15T14:12:48Z) - Semantic Graphs for Generating Deep Questions [98.5161888878238]
本稿では、まず、入力文書のセマンティックレベルグラフを構築し、次にアテンションベースのGGNN(Att-GGNN)を導入してセマンティックグラフを符号化する新しいフレームワークを提案する。
HotpotQAのDeep-question中心のデータセットでは、複数の事実の推論を必要とする問題よりもパフォーマンスが大幅に向上し、最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-27T10:52:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。