Fugu-MT 論文翻訳(概要): Joint Entity and Relation Canonicalization in Open Knowledge Graphs using Variational Autoencoders

論文の概要: Joint Entity and Relation Canonicalization in Open Knowledge Graphs using Variational Autoencoders

arxiv url: http://arxiv.org/abs/2012.04780v1
Date: Tue, 8 Dec 2020 22:58:30 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-16 17:37:19.498814
Title: Joint Entity and Relation Canonicalization in Open Knowledge Graphs using Variational Autoencoders
Title（参考訳）: 変分オートエンコーダを用いたオープン知識グラフの結合エンティティと関係正準化
Authors: Sarthak Dash, Gaetano Rossiello, Nandana Mihindukulasooriya, Sugato Bagchi, Alfio Gliozzo
Abstract要約: オープンナレッジグラフの名詞句と関係句は正規化されず、冗長で曖昧な主語関係対象のトリプルが爆発する。まず、名詞句と関係句の両方の埋め込み表現を生成し、次にクラスタリングアルゴリズムを使用して、埋め込みを機能としてグループ化します。本研究では,組込みとクラスタ割り当ての両方をエンドツーエンドアプローチで学習する共同モデルであるCUVA(Canonicalizing Using Variational AutoEncoders)を提案する。
参考スコア（独自算出の注目度）: 11.259587284318835
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Noun phrases and relation phrases in open knowledge graphs are not canonicalized, leading to an explosion of redundant and ambiguous subject-relation-object triples. Existing approaches to face this problem take a two-step approach: first, they generate embedding representations for both noun and relation phrases, then a clustering algorithm is used to group them using the embeddings as features. In this work, we propose Canonicalizing Using Variational AutoEncoders (CUVA), a joint model to learn both embeddings and cluster assignments in an end-to-end approach, which leads to a better vector representation for the noun and relation phrases. Our evaluation over multiple benchmarks shows that CUVA outperforms the existing state of the art approaches. Moreover, we introduce CanonicNell a novel dataset to evaluate entity canonicalization systems.
Abstract（参考訳）: オープンナレッジグラフの名詞句と関係句は正規化されておらず、冗長で曖昧な主題関係オブジェクトの3重項が爆発する。まず、名詞句と関係句の両方に埋め込み表現を生成し、次にクラスタリングアルゴリズムを使用して埋め込みを特徴としてグループ化する。本研究では,変分オートエンコーダ(CUVA)を用いた正規化手法を提案する。これは,組込みとクラスタ割り当ての両方をエンドツーエンドのアプローチで学習するジョイントモデルであり,名詞と関係句のベクトル表現が向上する。複数のベンチマークによる評価の結果,CUVAは既存の最先端技術よりも優れていた。さらに,エンティティの正準化システムを評価するための新しいデータセットであるcanonicnellを紹介する。

関連論文リスト

Self Supervised Correlation-based Permutations for Multi-View Clustering [7.972599673048582]
汎用データのためのエンドツーエンドのディープラーニングベースのMVCフレームワークを提案する。我々のアプローチは、新しい置換に基づく正準相関目標を用いて有意義な融合データ表現を学習することである。 10つのMVCベンチマークデータセットを用いて、モデルの有効性を実証する。
論文参考訳（メタデータ） (2024-02-26T08:08:30Z)
Contextual Dictionary Lookup for Knowledge Graph Completion [32.493168863565465]
知識グラフ補完(KGC)は、知識グラフの不完全性(KGs)を解決することを目的として、既知の三重項から欠落するリンクを予測する。既存の埋め込みモデルは、それぞれの関係を一意なベクトルにマッピングし、異なる実体の下でそれらの特定の粒度のセマンティクスを見渡す。本稿では,従来の埋め込みモデルを用いて,関係の微粒なセマンティクスをエンド・ツー・エンドで学習することのできる,文脈辞書検索を利用した新しい手法を提案する。
論文参考訳（メタデータ） (2023-06-13T12:13:41Z)
Information Retrieval in long documents: Word clustering approach for improving Semantics [0.0]
本稿では,長い文書の場合のセマンティック情報検索のためのディープニューラルネットワークの代替案を提案する。クラスタリング技術を活用したこの新しいアプローチは、長文と短文を対象とする情報検索システムにおける単語の意味を考慮に入れている。
論文参考訳（メタデータ） (2023-02-20T18:32:57Z)
Mutual Exclusivity Training and Primitive Augmentation to Induce Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文参考訳（メタデータ） (2022-11-28T17:36:41Z)
Unified Multi-View Orthonormal Non-Negative Graph Based Clustering Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文参考訳（メタデータ） (2022-11-03T08:18:27Z)
Repurposing Knowledge Graph Embeddings for Triple Representation via Weak Supervision [77.34726150561087]
現在の方法では、事前訓練されたモデルからの実体と述語埋め込みを使わずに、スクラッチから三重埋め込みを学習する。本研究では,知識グラフからトリプルを自動抽出し,事前学習した埋め込みモデルからそれらのペアの類似性を推定する手法を開発した。これらのペアの類似度スコアは、細い三重表現のためにシームズ様のニューラルネットワークに供給される。
論文参考訳（メタデータ） (2022-08-22T14:07:08Z)
Multi-View Clustering for Open Knowledge Base Canonicalization [9.976636206355394]
大規模オープンナレッジベース(OKB)における名詞句と関係句は標準化されていない。 CMVCは、知識の2つのビューを協調的に活用し、OKBを標準化するための新しい教師なしフレームワークである。我々は,複数の実世界のOKBデータセットに対して,最先端の手法に対する広範な実験を通じて,我々のフレームワークの優位性を実証する。
論文参考訳（メタデータ） (2022-06-22T14:23:16Z)
Event-Driven News Stream Clustering using Entity-Aware Contextual Embeddings [14.225334321146779]
本稿では,非パラメトリックストリーミングk-meansアルゴリズムの変種であるオンラインニュースストリームクラスタリング手法を提案する。我々のモデルはスパースと密集した文書表現の組み合わせを使用し、これらの複数の表現に沿って文書とクラスタの類似性を集約する。事前学習したトランスフォーマモデルにおいて,適切な微調整目標と外部知識を用いることにより,文脈埋め込みの有効性が大幅に向上することを示す。
論文参考訳（メタデータ） (2021-01-26T19:58:30Z)
Keyphrase Extraction with Dynamic Graph Convolutional Networks and Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文参考訳（メタデータ） (2020-10-24T08:11:23Z)
Clustering-based Unsupervised Generative Relation Extraction [3.342376225738321]
クラスタリングに基づく教師なし生成関係抽出フレームワーク(CURE)を提案する。我々は「エンコーダ・デコーダ」アーキテクチャを用いて自己教師付き学習を行い、エンコーダが関係情報を抽出できるようにする。我々のモデルは、ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおいて、最先端モデルよりも優れている。
論文参考訳（メタデータ） (2020-09-26T20:36:40Z)
Dual Adversarial Auto-Encoders for Clustering [152.84443014554745]
教師なしクラスタリングのためのDual-AAE(Dual-AAE)を提案する。 Dual-AAEの目的関数に対する変分推論を行うことで,一対のオートエンコーダをトレーニングすることで最適化可能な新たな再構成損失を導出する。 4つのベンチマーク実験により、Dual-AAEは最先端のクラスタリング手法よりも優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2020-08-23T13:16:34Z)
Active Learning for Coreference Resolution using Discrete Annotation [76.36423696634584]
我々は、コア参照解決におけるアクティブラーニングのためのペアワイズアノテーションを改善した。提案された参照ペアがコアフェレントでないと判断された場合、アノテータに参照アンテセントを識別するよう依頼する。既存のベンチマークコアベンチマークデータセットを用いた実験では、この追加質問からの信号が人間のアノテーション時間当たりの大幅なパフォーマンス向上につながることが示された。
論文参考訳（メタデータ） (2020-04-28T17:17:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。