Fugu-MT 論文翻訳(概要): AutoKG: Constructing Virtual Knowledge Graphs from Unstructured Documents for Question Answering

論文の概要: AutoKG: Constructing Virtual Knowledge Graphs from Unstructured Documents for Question Answering

arxiv url: http://arxiv.org/abs/2008.08995v2
Date: Wed, 10 Mar 2021 20:45:02 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-27 03:32:31.529161
Title: AutoKG: Constructing Virtual Knowledge Graphs from Unstructured Documents for Question Answering
Title（参考訳）: AutoKG: 質問応答のための構造化されていないドキュメントから仮想知識グラフを構築する
Authors: Seunghak Yu, Tianxing He, James Glass
Abstract要約: 構造化されていない文書から知識グラフを自動的に構築する新しいフレームワークを提案する。まず、構造化されていない文書から知識を抽出し、それらを文脈情報でエンコードする。同様のコンテキスト意味を持つエンティティは、内部アライメントを通じてリンクされ、グラフ構造を形成する。これにより、手作業で生成したKGをトラバースすることで、複数の文書から所望の情報を抽出することができる。
参考スコア（独自算出の注目度）: 19.72815568759182
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Knowledge graphs (KGs) have the advantage of providing fine-grained detail for question-answering systems. Unfortunately, building a reliable KG is time-consuming and expensive as it requires human intervention. To overcome this issue, we propose a novel framework to automatically construct a KG from unstructured documents that does not require external alignment. We first extract surface-form knowledge tuples from unstructured documents and encode them with contextual information. Entities with similar context semantics are then linked through internal alignment to form a graph structure. This allows us to extract the desired information from multiple documents by traversing the generated KG without a manual process. We examine its performance in retrieval based QA systems by reformulating the WikiMovies and MetaQA datasets into a tuple-level retrieval task. The experimental results show that our method outperforms traditional retrieval methods by a large margin.
Abstract（参考訳）: 知識グラフ(KG)は、質問応答システムにきめ細かい詳細を提供する利点がある。残念なことに、信頼できるKGの構築には時間と費用がかかる。そこで本稿では,外部アライメントを必要としない非構造化文書からKGを自動的に構築するフレームワークを提案する。まず,非構造化文書から表層的な知識タプルを抽出し,文脈情報でエンコードする。同様のコンテキスト意味を持つエンティティは、内部アライメントを通してリンクされ、グラフ構造を形成する。これにより、生成したkgを手動プロセスなしで横断することで、複数の文書から所望の情報を抽出することができる。 WikiMoviesとMetaQAのデータセットをタプルレベルの検索タスクに書き換えることで,検索に基づくQAシステムの性能を評価する。実験の結果,提案手法は従来の検索手法よりも高い性能を示した。

関連論文リスト

MoDora: Tree-Based Semi-Structured Document Analysis System [62.01015188258797]
半構造化文書は、様々な不規則なレイアウトで配置された様々なインターリーブされたデータ要素を統合する。 MoDora は半構造化文書解析のための LLM を利用したシステムである。実験では、MoDoraは5.97%-61.07%の精度でベースラインを上回っている。
論文参考訳（メタデータ） (2026-02-26T14:48:49Z)
BookRAG: A Hierarchical Structure-aware Index-based Approach for Retrieval-Augmented Generation on Complex Documents [11.158307125677375]
Retrieval-Augmented Generation (RAG)は、外部の複雑なドキュメントから非常に関連性の高い情報をクエリする。本稿では,階層構造を持つ文書を対象とした新しいRAG手法であるBookRAGを紹介する。 BookRAGは最先端のパフォーマンスを実現し、検索リコールとQA精度の両方において、ベースラインを著しく上回っている。
論文参考訳（メタデータ） (2025-12-03T03:40:49Z)
Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文参考訳（メタデータ） (2025-08-15T06:36:13Z)
Hierarchical Retrieval with Evidence Curation for Open-Domain Financial Question Answering on Standardized Documents [17.506934704019226]
標準化されたドキュメントは、反復的なボイラープレートテキストや同様のテーブル構造など、同様のフォーマットを共有している。この類似性により、従来のRAGメソッドは、ほぼ重複したテキストを誤識別し、精度と完全性を損なう重複検索につながる。本稿では,これらの問題に対処するためのEvidence Curationフレームワークを用いた階層検索手法を提案する。
論文参考訳（メタデータ） (2025-05-26T11:08:23Z)
Ontology-Guided, Hybrid Prompt Learning for Generalization in Knowledge Graph Question Answering [6.232269207752904]
OntoSCPromptは,2段階アーキテクチャを持つ新しい大規模言語モデル(LLM)ベースのKGQAアプローチである。 OntoSCPromptはまず、SPARQLクエリ構造(SELECT、ASK、WHERE、トークン不足のためのプレースホルダーなどのSPARQLキーワードを含む)を生成し、KG固有の情報でそれらを埋める。両段階で生成されたSPARQLクエリの正しさと実行性を保証するために,タスク固有のデコーディング戦略をいくつか提示する。
論文参考訳（メタデータ） (2025-02-06T11:47:58Z)
Ontology-grounded Automatic Knowledge Graph Construction by LLM under Wikidata schema [60.42231674887294]
本稿では,Large Language Models (LLMs) を用いた知識グラフ構築のためのオントロジー的アプローチを提案する。我々は、一貫性と解釈可能性を確保するために、抽出された関係に基づいて、著者によるオントロジーによるKGの基底生成を行う。我々の研究は、人間の介入を最小限に抑えたスケーラブルなKG建設パイプラインの実現に向けて有望な方向を示し、高品質で人間に解釈可能なKGを生み出す。
論文参考訳（メタデータ） (2024-12-30T13:36:05Z)
iText2KG: Incremental Knowledge Graphs Construction Using Large Language Models [0.7165255458140439]
iText2KGは、後処理なしで漸進的にトピックに依存しない知識グラフを構築する方法である。提案手法は,3つのシナリオにまたがるベースライン手法と比較して,優れた性能を示す。
論文参考訳（メタデータ） (2024-09-05T06:49:14Z)
PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文参考訳（メタデータ） (2023-09-16T04:29:05Z)
Text-To-KG Alignment: Comparing Current Methods on Classification Tasks [2.191505742658975]
知識グラフ(KG)は、事実情報の密集した構造化された表現を提供する。最近の研究は、追加のコンテキストとしてKGから情報を取得するパイプラインモデルの作成に重点を置いている。現在のメソッドが、アライメントされたサブグラフがクエリに完全に関連しているシナリオとどのように比較されているかは分かっていない。
論文参考訳（メタデータ） (2023-06-05T13:45:45Z)
A Universal Question-Answering Platform for Knowledge Graphs [7.2676028986202]
我々は,各ターゲットKGに合わせて調整する必要がない汎用QAシステムであるKGQAnを提案する。 KGQAnは、回答の質や処理時間の点で、最先端の大幅なマージンによって容易にデプロイされ、性能が向上する。
論文参考訳（メタデータ） (2023-03-01T15:35:32Z)
UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文参考訳（メタデータ） (2022-12-02T04:08:09Z)
Query-Specific Knowledge Graphs for Complex Finance Topics [6.599344783327053]
ドメインの専門家が挑戦的な質問を作成できるCODECデータセットに重点を置いています。最先端のランキングシステムには改善の余地があることが示される。実体と文書の関連性は正の相関関係にあることを示す。
論文参考訳（メタデータ） (2022-11-08T10:21:13Z)
Detect, Retrieve, Comprehend: A Flexible Framework for Zero-Shot Document-Level Question Answering [6.224211330728391]
研究者は貴重な技術知識を含む何千もの学術文書を作成した。文書レベルの質問応答(QA)は、人間の提案する質問を適応して多様な知識を抽出できる柔軟なフレームワークを提供する。本稿では,PDFからテキストを抽出する3段階の文書QAアプローチ,抽出したテキストからエビデンスを抽出して適切な文脈を形成する方法,文脈から知識を抽出して高品質な回答を返すためのQAを提案する。
論文参考訳（メタデータ） (2022-10-04T23:33:52Z)
Generate rather than Retrieve: Large Language Models are Strong Context Generators [74.87021992611672]
本稿では,文書検索を大規模言語モデル生成器に置き換えることで,知識集約型タスクを解く新しい視点を提案する。我々は,提案手法をgenRead (genRead) と呼び,まず大きな言語モデルに対して,与えられた質問に基づいて文脈文書を生成し,次に生成された文書を読み出して最終回答を生成する。
論文参考訳（メタデータ） (2022-09-21T01:30:59Z)
Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文参考訳（メタデータ） (2022-06-21T18:16:31Z)
Autoregressive Search Engines: Generating Substrings as Document Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文参考訳（メタデータ） (2022-04-22T10:45:01Z)
Semantic Graphs for Generating Deep Questions [98.5161888878238]
本稿では、まず、入力文書のセマンティックレベルグラフを構築し、次にアテンションベースのGGNN(Att-GGNN)を導入してセマンティックグラフを符号化する新しいフレームワークを提案する。 HotpotQAのDeep-question中心のデータセットでは、複数の事実の推論を必要とする問題よりもパフォーマンスが大幅に向上し、最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2020-04-27T10:52:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。