論文の概要: KG-FRUS: a Novel Graph-based Dataset of 127 Years of US Diplomatic
Relations
- arxiv url: http://arxiv.org/abs/2311.01606v1
- Date: Mon, 30 Oct 2023 10:53:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-12 19:56:39.390942
- Title: KG-FRUS: a Novel Graph-based Dataset of 127 Years of US Diplomatic
Relations
- Title(参考訳): KG-FRUS:米国外交関係127年間のグラフベースの新しいデータセット
- Authors: G\"okberk \"Ozsoy, Luis Salamanca, Matthew Connelly, Raymond Hicks and
Fernando P\'erez-Cruz
- Abstract要約: 我々は、米国の外交関係(FRUS)のデータを活用して、文書に関する情報を抽出する。
抽出されたエンティティと関連するメタデータを使用して、グラフベースのデータセットを作成します。
KGの関係は外交、外交、外交、政治の複雑な分野の研究と理解に必要なシナジーとダイナミクスを捉えている。
- 参考スコア(独自算出の注目度): 42.87502453001109
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the current paper, we present the KG-FRUS dataset, comprised of more than
300,000 US government diplomatic documents encoded in a Knowledge Graph (KG).
We leverage the data of the Foreign Relations of the United States (FRUS)
(available as XML files) to extract information about the documents and the
individuals and countries mentioned within them. We use the extracted entities,
and associated metadata, to create a graph-based dataset. Further, we
supplement the created KG with additional entities and relations from Wikidata.
The relations in the KG capture the synergies and dynamics required to study
and understand the complex fields of diplomacy, foreign relations, and
politics. This goes well beyond a simple collection of documents which neglects
the relations between entities in the text. We showcase a range of
possibilities of the current dataset by illustrating different approaches to
probe the KG. In the paper, we exemplify how to use a query language to answer
simple research questions and how to use graph algorithms such as Node2Vec and
PageRank, that benefit from the complete graph structure. More importantly, the
chosen structure provides total flexibility for continuously expanding and
enriching the graph. Our solution is general, so the proposed pipeline for
building the KG can encode other original corpora of time-dependent and complex
phenomena. Overall, we present a mechanism to create KG databases providing a
more versatile representation of time-dependent related text data and a
particular application to the all-important FRUS database.
- Abstract(参考訳): 本稿では,米国政府の外交文書を知識グラフ(kg)にエンコードした30万以上の国文書からなるkg-frusデータセットを提案する。
我々は、米国の外交関係(frus)のデータ(xmlファイルとして利用可能)を利用して、文書やその中に言及されている個人や国に関する情報を抽出する。
抽出されたエンティティと関連するメタデータを使用して、グラフベースのデータセットを作成します。
さらに、生成したKGをWikidataから追加のエンティティと関係を補足する。
kgにおける関係は、外交、外交、政治といった複雑な分野の研究と理解に必要なシナジーとダイナミクスを捉えている。
これは、テキスト内のエンティティ間の関係を無視する、単純なドキュメントのコレクションを越えている。
我々は、現在のデータセットの様々な可能性を示し、kgを探索する異なるアプローチを図示する。
本稿では、単純な研究質問に対するクエリ言語の使用方法と、完全なグラフ構造から恩恵を受けるNode2VecやPageRankといったグラフアルゴリズムの使用方法を例示する。
さらに重要なことに、選択された構造は、グラフを継続的に拡張し、拡張するための完全な柔軟性を提供します。
提案したKG構築パイプラインは、時間に依存した複雑な現象の他の元のコーパスを符号化することができる。
全体として、時間依存関連テキストデータのより汎用的な表現を提供するKGデータベース作成機構と、全重要FRUSデータベースへの特定の応用について述べる。
関連論文リスト
- Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval [49.42043077545341]
知識グラフ(KG)から構造化文書関係を付加したLLMを拡張した知識対応クエリ拡張フレームワークを提案する。
文書テキストをリッチなKGノード表現として活用し、KAR(Knowledge-Aware Retrieval)のための文書ベースの関係フィルタリングを利用する。
論文 参考訳(メタデータ) (2024-10-17T17:03:23Z) - A Prompt-Based Knowledge Graph Foundation Model for Universal In-Context Reasoning [17.676185326247946]
そこで本研究では,テキスト内学習,すなわちKG-ICLを介し,プロンプトに基づくKGファウンデーションモデルを提案する。
クエリにおけるエンティティや関係を発見できないような一般化機能を備えたプロンプトグラフを符号化するために,まず統一トークン化器を提案する。
そこで我々は,プロンプトエンコーディングとKG推論を行う2つのメッセージパッシングニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-10-16T06:47:18Z) - iText2KG: Incremental Knowledge Graphs Construction Using Large Language Models [0.7165255458140439]
iText2KGは、後処理なしで漸進的にトピックに依存しない知識グラフを構築する方法である。
提案手法は,3つのシナリオにまたがるベースライン手法と比較して,優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-05T06:49:14Z) - Retrieval-Augmented Language Model for Extreme Multi-Label Knowledge Graph Link Prediction [2.6749568255705656]
大規模言語モデル(LLM)における開放的調査のための外挿は2つの重要な問題に遭遇する。
既存の作業は、知識グラフからの情報により、より小さな言語モデルの入力を増大させることによって、この問題に対処しようとするものである。
我々は,モデルが複数の応答で外挿を行うことを可能にするために,新たなタスク,極端なマルチラベルKGリンク予測タスクを提案する。
論文 参考訳(メタデータ) (2024-05-21T10:10:56Z) - Deep Bidirectional Language-Knowledge Graph Pretraining [159.9645181522436]
DRAGONは、テキストとKGを大規模に融合した言語知識基盤モデルを事前学習するための自己教師型アプローチである。
我々のモデルは、入力としてテキストセグメントと関連するKGサブグラフのペアを取り、両モードから情報を双方向に融合する。
論文 参考訳(メタデータ) (2022-10-17T18:02:52Z) - BertNet: Harvesting Knowledge Graphs with Arbitrary Relations from
Pretrained Language Models [65.51390418485207]
本稿では,事前学習したLMから任意の関係を持つ大規模KGを抽出する手法を提案する。
関係定義の最小限の入力により、アプローチは膨大な実体対空間を効率的に探索し、多様な正確な知識を抽出する。
我々は、異なるLMから400以上の新しい関係を持つKGを収穫するためのアプローチを展開している。
論文 参考訳(メタデータ) (2022-06-28T19:46:29Z) - EventNarrative: A large-scale Event-centric Dataset for Knowledge
Graph-to-Text Generation [8.216976747904726]
EventNarrativeは,約23万のグラフと,対応する自然言語テキストで構成されている。
私たちの目標は2つある – データが不足しているイベント中心の研究において,新たな基盤を突破する上で,研究者が明確に定義された大規模データセットを提供することです。
論文 参考訳(メタデータ) (2021-10-30T15:39:20Z) - RAGA: Relation-aware Graph Attention Networks for Global Entity
Alignment [14.287681294725438]
実体と関係の相互作用を捉えるために,Relation-aware Graph Attention Networksに基づく新しいフレームワークを提案する。
本フレームワークでは,エンティティ情報を関係に分散し,関係情報をエンティティに集約する自己認識機構を採用している。
論文 参考訳(メタデータ) (2021-03-01T06:30:51Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z) - Generative Adversarial Zero-Shot Relational Learning for Knowledge
Graphs [96.73259297063619]
我々は、この厄介なキュレーションを解放するために、新しい定式化、ゼロショット学習を考える。
新たに追加された関係について,テキスト記述から意味的特徴を学習しようと試みる。
我々は,GAN(Generative Adrial Networks)を活用し,テキストと知識グラフ領域の接続を確立する。
論文 参考訳(メタデータ) (2020-01-08T01:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。