論文の概要: Joint Open Knowledge Base Canonicalization and Linking
- arxiv url: http://arxiv.org/abs/2212.01207v1
- Date: Fri, 2 Dec 2022 14:38:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 15:45:47.441919
- Title: Joint Open Knowledge Base Canonicalization and Linking
- Title(参考訳): 共同オープン知識ベース標準化とリンク
- Authors: Yinan Liu and Wei Shen and Yuanfei Wang and Jianyong Wang and Zhenglu
Yang and Xiaojie Yuan
- Abstract要約: オープンナレッジベースにおける名詞句(NP)と関係句(RP)は正規化されていない。
本稿では,因子グラフモデルに基づく新しいフレームワークJOCLを提案する。
- 参考スコア(独自算出の注目度): 24.160755953937763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open Information Extraction (OIE) methods extract a large number of OIE
triples (noun phrase, relation phrase, noun phrase) from text, which compose
large Open Knowledge Bases (OKBs). However, noun phrases (NPs) and relation
phrases (RPs) in OKBs are not canonicalized and often appear in different
paraphrased textual variants, which leads to redundant and ambiguous facts. To
address this problem, there are two related tasks: OKB canonicalization (i.e.,
convert NPs and RPs to canonicalized form) and OKB linking (i.e., link NPs and
RPs with their corresponding entities and relations in a curated Knowledge Base
(e.g., DBPedia). These two tasks are tightly coupled, and one task can benefit
significantly from the other. However, they have been studied in isolation so
far. In this paper, we explore the task of joint OKB canonicalization and
linking for the first time, and propose a novel framework JOCL based on factor
graph model to make them reinforce each other. JOCL is flexible enough to
combine different signals from both tasks, and able to extend to fit any new
signals. A thorough experimental study over two large scale OIE triple data
sets shows that our framework outperforms all the baseline methods for the task
of OKB canonicalization (OKB linking) in terms of average F1 (accuracy).
- Abstract(参考訳): オープンインフォメーション抽出(OIE)手法は、大量のオープンナレッジベース(OKB)を構成する大量のOIEトリプル(名詞句、関係句、名詞句)をテキストから抽出する。
しかし、OKBの名詞句(NPs)と関係句(RPs)は正規化されておらず、しばしば異なるパラフレーズのテキスト変種に現れ、冗長で曖昧な事実をもたらす。
この問題に対処するためには、OKB正準化(英語版)(NPとRPを正準化形式に変換する)とOKBリンク(英語版)(NPとRPを対応するエンティティとリンクする、DBPediaなど)という2つの関連するタスクがある。
これら2つのタスクは密結合であり、一方のタスクはもう一方のタスクから著しく恩恵を受ける可能性がある。
しかし、これまでは孤立して研究されてきた。
本稿では,okbの正準化とリンクの課題を初めて検討し,それらを相互に強化するための因子グラフモデルに基づく新しいフレームワークjoclを提案する。
JOCLは両方のタスクから異なる信号を組み合わせるのに十分な柔軟性があり、新しい信号に合うように拡張することができる。
2つの大規模OIEトリプルデータセットに関する徹底的な実験的研究により、我々のフレームワークは平均F1(精度)でOKB標準化(OKBリンク)タスクのベースラインメソッドを全て上回っていることが示された。
関連論文リスト
- REXEL: An End-to-end Model for Document-Level Relation Extraction and Entity Linking [11.374031643273941]
REXELは文書レベルcIE(DocIE)の共同作業のための高効率かつ高精度なモデルである
同様の環境では、競合する既存のアプローチよりも平均11倍高速です。
速度と精度の組み合わせにより、REXELはWebスケールで構造化された情報を抽出する正確なコスト効率のシステムとなる。
論文 参考訳(メタデータ) (2024-04-19T11:04:27Z) - Open Knowledge Base Canonicalization with Multi-task Learning [18.053863554106307]
大規模なオープン知識ベース(OKB)は、Web検索のような世界規模のWeb上の多くの知識駆動アプリケーションに不可欠なものである。
OKBの名詞句と関係句は、しばしば冗長性と曖昧さに悩まされ、OKBの正準化の調査を要求する。
現在のソリューションは、高度なクラスタリングアルゴリズムを考案し、知識グラフ埋め込み(KGE)を使用して、標準化プロセスをさらに促進することでOKB標準化に対処している。
我々は、OKB標準化に取り組むためにマルチタスク学習フレームワーク、MulCanonを提案しました。
論文 参考訳(メタデータ) (2024-03-21T08:03:46Z) - Open Knowledge Base Canonicalization with Multi-task Unlearning [19.130159457887]
MulCanonは、OKB標準化における機械学習問題に取り組むマルチタスクアンラーニングフレームワークである。
一般的なOKB標準化データセットに関する徹底的な実験的研究は、MulCanonが高度な機械学習効果を達成することを検証する。
論文 参考訳(メタデータ) (2023-10-25T07:13:06Z) - Text2NKG: Fine-Grained N-ary Relation Extraction for N-ary relational Knowledge Graph Construction [20.281505340983035]
Text2NKGは,n-aryリレーショナル知識グラフ構築のための,新しいn-aryリレーショナル抽出フレームワークである。
ヘテロオーダーのマージと出力マージを併用したスパンタプル分類手法を導入し,異なるアリティにおけるn-項関係抽出を実現する。
論文 参考訳(メタデータ) (2023-10-08T14:47:13Z) - Learnable Pillar-based Re-ranking for Image-Text Retrieval [119.9979224297237]
画像テキスト検索は、モダリティギャップを埋め、意味的類似性に基づいてモダリティコンテンツを検索することを目的としている。
一般的なポストプロセッシング手法であるリグレードは, 単一モダリティ検索タスクにおいて, 隣り合う関係を捕捉する優位性を明らかにしている。
本稿では,画像テキスト検索のための新しい学習可能な柱型リグレードパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-25T04:33:27Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Multi-View Clustering for Open Knowledge Base Canonicalization [9.976636206355394]
大規模オープンナレッジベース(OKB)における名詞句と関係句は標準化されていない。
CMVCは、知識の2つのビューを協調的に活用し、OKBを標準化するための新しい教師なしフレームワークである。
我々は,複数の実世界のOKBデータセットに対して,最先端の手法に対する広範な実験を通じて,我々のフレームワークの優位性を実証する。
論文 参考訳(メタデータ) (2022-06-22T14:23:16Z) - Text-based NP Enrichment [51.403543011094975]
我々は、テキストベースのNPエンリッチメント(TNE)のタスクを確立する。つまり、各NPに、テキスト内の他のNPとの間に保持されるすべての前置詞による関係を豊かにする。
人間はこのような関係をシームレスに回復するが、現在の最先端モデルは問題の暗黙的な性質のためにそれらと戦っている。
この問題に対する最初の大規模データセットを構築し、正式なフレーミングとアノテーションの範囲を提供し、データを解析し、タスクに微調整されたニューラルネットワークモデルの結果を報告する。
論文 参考訳(メタデータ) (2021-09-24T17:23:25Z) - Inferential Text Generation with Multiple Knowledge Sources and
Meta-Learning [117.23425857240679]
本研究では,テキストティフ・エルス関係のような多種多様なコモンセンスのイベントの推論テキストを生成する問題について検討する。
既存のアプローチでは、トレーニング例からの限られた証拠を使用して、個々の関係について学習するのが一般的である。
この研究では、モデルのための燃料として複数の知識ソースを使用します。
論文 参考訳(メタデータ) (2020-04-07T01:49:18Z) - Graph Structured Network for Image-Text Matching [127.68148793548116]
微粒化対応学習のためのグラフ構造化マッチングネットワークを提案する。
GSMNは、明示的にオブジェクト、関係、属性を構造化されたフレーズとしてモデル化する。
実験により、GSMNはベンチマークで最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-04-01T08:20:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。