論文の概要: Clustering-based Unsupervised Generative Relation Extraction
- arxiv url: http://arxiv.org/abs/2009.12681v1
- Date: Sat, 26 Sep 2020 20:36:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 08:19:27.327051
- Title: Clustering-based Unsupervised Generative Relation Extraction
- Title(参考訳): クラスタリングに基づく教師なし生成関係抽出
- Authors: Chenhan Yuan, Ryan Rossi, Andrew Katz, and Hoda Eldardiry
- Abstract要約: クラスタリングに基づく教師なし生成関係抽出フレームワーク(CURE)を提案する。
我々は「エンコーダ・デコーダ」アーキテクチャを用いて自己教師付き学習を行い、エンコーダが関係情報を抽出できるようにする。
我々のモデルは、ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおいて、最先端モデルよりも優れている。
- 参考スコア(独自算出の注目度): 3.342376225738321
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper focuses on the problem of unsupervised relation extraction.
Existing probabilistic generative model-based relation extraction methods work
by extracting sentence features and using these features as inputs to train a
generative model. This model is then used to cluster similar relations.
However, these methods do not consider correlations between sentences with the
same entity pair during training, which can negatively impact model
performance. To address this issue, we propose a Clustering-based Unsupervised
generative Relation Extraction (CURE) framework that leverages an
"Encoder-Decoder" architecture to perform self-supervised learning so the
encoder can extract relation information. Given multiple sentences with the
same entity pair as inputs, self-supervised learning is deployed by predicting
the shortest path between entity pairs on the dependency graph of one of the
sentences. After that, we extract the relation information using the
well-trained encoder. Then, entity pairs that share the same relation are
clustered based on their corresponding relation information. Each cluster is
labeled with a few words based on the words in the shortest paths corresponding
to the entity pairs in each cluster. These cluster labels also describe the
meaning of these relation clusters. We compare the triplets extracted by our
proposed framework (CURE) and baseline methods with a ground-truth Knowledge
Base. Experimental results show that our model performs better than
state-of-the-art models on both New York Times (NYT) and United Nations
Parallel Corpus (UNPC) standard datasets.
- Abstract(参考訳): 本稿では,教師なし関係抽出の問題に焦点をあてる。
既存の確率的生成モデルに基づく関係抽出法は、文の特徴を抽出し、これらの特徴を入力として生成モデルを訓練する。
このモデルは、同様の関係をクラスタするために使われる。
しかし、これらの方法はトレーニング中に同じエンティティペアを持つ文間の相関を考慮せず、モデルのパフォーマンスに悪影響を及ぼす可能性がある。
そこで本研究では,「エンコーダ-デコーダ」アーキテクチャを活用し,自己教師付き学習を行い,エンコーダが関係情報を抽出できるようにするクラスタリング型非教師付き生成関係抽出(cure)フレームワークを提案する。
入力と同じエンティティペアを持つ複数の文が与えられた場合、その1つの文の依存グラフ上のエンティティペア間の最短経路を予測して自己教師付き学習を行う。
その後、訓練されたエンコーダを用いて関係情報を抽出する。
そして、対応する関係情報に基づいて、同一の関係を共有するエンティティペアをクラスタリングする。
各クラスタは、各クラスタのエンティティペアに対応する最短経路のワードに基づいて、いくつかの単語でラベル付けされる。
これらのクラスタラベルは、これらの関係クラスタの意味も記述している。
提案するフレームワーク (cure) とベースライン法で抽出された三重項を基礎知識ベースと比較する。
実験の結果,ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおける最先端モデルよりも優れた性能を示した。
関連論文リスト
- TacoERE: Cluster-aware Compression for Event Relation Extraction [47.89154684352463]
イベント関係抽出は自然言語処理における決定的かつ基本的な課題である。
イベント関係抽出(TacoERE)を改善するクラスタ対応圧縮法を提案する。
論文 参考訳(メタデータ) (2024-05-11T03:06:08Z) - Entity or Relation Embeddings? An Analysis of Encoding Strategies for Relation Extraction [19.019881161010474]
関係抽出は、本質的にはテキスト分類問題であり、事前学習言語モデル(LM)を微調整することで取り組める。
既存のアプローチでは、LMを微調整して頭と尾のエンティティの埋め込みを学習し、それらのエンティティの埋め込みから関係を予測する。
本稿では,より直接的な方法で関係を捉えることにより,関係抽出モデルを改善することができるという仮説を立てる。
論文 参考訳(メタデータ) (2023-12-18T09:58:19Z) - It Takes Two Flints to Make a Fire: Multitask Learning of Neural
Relation and Explanation Classifiers [40.666590079580544]
一般化と説明可能性の間の緊張を緩和する関係抽出のための説明可能なアプローチを提案する。
提案手法では,関係抽出のための分類器を共同で訓練するマルチタスク学習アーキテクチャを用いる。
このアプローチにグローバルな説明をもたらすために、モデル出力をルールに変換する。
論文 参考訳(メタデータ) (2022-04-25T03:53:12Z) - ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial
Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。
提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文 参考訳(メタデータ) (2022-03-01T02:32:25Z) - A Relation-Oriented Clustering Method for Open Relation Extraction [18.20811491136624]
関係指向クラスタリングモデルを提案し,それを用いてラベルなしデータの新しい関係を同定する。
我々は、インスタンスを対応する関係セントロイドに向かって集めることで、同じ関係を持つインスタンス間の距離を最小化する。
実験の結果,2つのデータセットに対して誤差率を29.2%,15.7%削減できることがわかった。
論文 参考訳(メタデータ) (2021-09-15T10:46:39Z) - Element Intervention for Open Relation Extraction [27.408443348900057]
OpenREは、同じ基盤となる関係を参照する関係インスタンスをクラスタ化することを目的としている。
現在のOpenREモデルは、一般的に遠隔監視から生成されたデータセットに基づいてトレーニングされている。
本稿では,OpenREの手順を因果的観点から再考する。
論文 参考訳(メタデータ) (2021-06-17T14:37:13Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Relation Extraction with Contextualized Relation Embedding (CRE) [6.030060645424665]
本稿では,意味情報と知識ベースモデリングを統合した関係抽出タスクのアーキテクチャを提案する。
本稿では、関係抽出においてKBモデリングを内部化するモデルアーキテクチャを提案する。
提案したCREモデルは、The New York Times Annotated CorpusとFreeBaseから派生したデータセット上でのアートパフォーマンスの状態を達成している。
論文 参考訳(メタデータ) (2020-11-19T05:19:46Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - SelfORE: Self-supervised Relational Feature Learning for Open Relation
Extraction [60.08464995629325]
オープンドメイン関係抽出は、自然言語文からオープンドメイン関係事実を抽出するタスクである。
弱い自己教師型信号を利用する自己教師型フレームワークであるSelfOREを提案する。
3つのデータセットの実験結果は、SelfOREの有効性とロバスト性を示している。
論文 参考訳(メタデータ) (2020-04-06T07:23:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。