論文の概要: PromptORE -- A Novel Approach Towards Fully Unsupervised Relation
Extraction
- arxiv url: http://arxiv.org/abs/2304.01209v1
- Date: Fri, 24 Mar 2023 12:55:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-09 05:34:10.243799
- Title: PromptORE -- A Novel Approach Towards Fully Unsupervised Relation
Extraction
- Title(参考訳): PromptORE - 完全教師なし関係抽出に向けた新しいアプローチ
- Authors: Pierre-Yves Genest (Alteca, DRIM), Pierre-Edouard Portier (DRIM),
El\"od Egyed-Zsigmond (DRIM), Laurent-Walter Goix (Alteca)
- Abstract要約: 教師なし関係抽出(RE)は、トレーニング中にラベル付きデータにアクセスすることなく、テキスト内のエンティティ間の関係を識別することを目的としている。
本稿では,'Prompt-based Open Relation extract'モデルであるPromptOREを提案する。
我々は、新しいプロンプトチューニングパラダイムを教師なしの設定に適応させ、関係を表す文を埋め込む。
PromptOREは,B,V,ARIの40%以上の増加率を持つ最先端モデルより一貫して優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised Relation Extraction (RE) aims to identify relations between
entities in text, without having access to labeled data during training. This
setting is particularly relevant for domain specific RE where no annotated
dataset is available and for open-domain RE where the types of relations are a
priori unknown. Although recent approaches achieve promising results, they
heavily depend on hyperparameters whose tuning would most often require labeled
data. To mitigate the reliance on hyperparameters, we propose PromptORE, a
''Prompt-based Open Relation Extraction'' model. We adapt the novel
prompt-tuning paradigm to work in an unsupervised setting, and use it to embed
sentences expressing a relation. We then cluster these embeddings to discover
candidate relations, and we experiment different strategies to automatically
estimate an adequate number of clusters. To the best of our knowledge,
PromptORE is the first unsupervised RE model that does not need hyperparameter
tuning. Results on three general and specific domain datasets show that
PromptORE consistently outperforms state-of-the-art models with a relative gain
of more than 40% in B 3 , V-measure and ARI. Qualitative analysis also
indicates PromptORE's ability to identify semantically coherent clusters that
are very close to true relations.
- Abstract(参考訳): unsupervised relation extraction (re)は、トレーニング中にラベル付きデータにアクセスせずに、テキスト内のエンティティ間の関係を識別することを目的としている。
この設定は、アノテーション付きデータセットが利用できないドメイン固有のREと、関係のタイプが未知のオープンドメインREに特に関係している。
最近のアプローチでは有望な結果が得られるが、チューニングがラベル付きデータを必要とすることが多いハイパーパラメータに大きく依存している。
ハイパーパラメータへの依存を軽減するため,'Prompt-based Open Relation extract'モデルであるPromptOREを提案する。
我々は,教師なし設定で作業するために,新しいプロンプト・チューニング・パラダイムを適用し,関係を表す文を埋め込む。
次に、これらの埋め込みをクラスタ化して候補関係を発見し、適切なクラスタ数を自動的に見積もるさまざまな戦略を実験します。
我々の知る限りでは、PromptOREはハイパーパラメータチューニングを必要としない最初の教師なしREモデルである。
3つの一般および特定のドメインデータセットの結果から、PromptOREはB3、V測定、ARIの40%以上の相対的なゲインを持つ最先端モデルよりも一貫して優れていた。
定性的分析はまた、真の関係に非常に近い意味的コヒーレントなクラスタを特定できる PromptORE の能力を示している。
関連論文リスト
- Silver Syntax Pre-training for Cross-Domain Relation Extraction [20.603482820770356]
関係抽出(RE)は、特に現実的な領域外評価を考える場合、依然として困難な課題である。
高品質な(手動で注釈付けされた)データを取得するのは非常に高価であり、新しいドメインごとに現実的に繰り返すことはできない。
関連するタスクからのデータに対する中間的なトレーニングステップは、多くのNLPタスクで有用であることが示されているが、このセットアップには追加のアノテートデータが必要であるため、しばしば利用できない。
本稿では,REのための中間的事前学習について検討する。構文構造と意味的REとの親和性を利用して,2つのエンティティ間の最も短い依存性パスにあることで,REと密接に関連する構文関係を同定する。
論文 参考訳(メタデータ) (2023-05-18T14:49:19Z) - EDeR: A Dataset for Exploring Dependency Relations Between Events [12.215649447070664]
人間アノテーション付きイベント依存関係データセット(EDeR)を紹介する。
この関係を認識することで、より正確なイベント抽出が可能になることを示す。
我々は,3方向の分類を必須引数,任意引数,あるいは非議論に予測することは,より困難な課題であることを示した。
論文 参考訳(メタデータ) (2023-04-04T08:07:07Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt
Tuning [109.7767515627765]
本稿では,関係抽出のための新たな半パラメトリックなプロンプトチューニング手法を提案する。
我々のモデルは、トレーニング中に重みに格納された知識を通して関係を推測する。
本手法は,標準的な教師付き設定と少数ショット設定の両方で最先端を実現することができる。
論文 参考訳(メタデータ) (2022-05-04T23:38:37Z) - Does Recommend-Revise Produce Reliable Annotations? An Analysis on
Missing Instances in DocRED [60.39125850987604]
テキスト修正方式は, 偽陰性サンプルと, 人気エンティティや関係性に対する明らかな偏見をもたらすことを示す。
より信頼性の高いドキュメントREモデルのテストセットとして機能するように、relabeledデータセットがリリースされている。
論文 参考訳(メタデータ) (2022-04-17T11:29:01Z) - RelationPrompt: Leveraging Prompts to Generate Synthetic Data for
Zero-Shot Relation Triplet Extraction [65.4337085607711]
ゼロショット関係トリプルト抽出(ZeroRTE)のタスク設定について紹介する。
入力文が与えられた後、抽出された各三重項は、トレーニング段階で関係ラベルが見えないヘッドエンティティ、リレーションラベル、テールエンティティから構成される。
本稿では、言語モデルに構造化テキストを生成するよう促すことで、関係例を合成する。
論文 参考訳(メタデータ) (2022-03-17T05:55:14Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Relation of the Relations: A New Paradigm of the Relation Extraction
Problem [52.21210549224131]
我々は,関係抽出(RE)の新たなパラダイムを提案し,同じ文脈におけるすべての関係の予測を総合的に検討する。
我々は、手作りのルールを必要としないデータ駆動型アプローチを開発し、グラフニューラルネットワークと関係行列変換器を用いた関係関係(RoR)をそれ自体で学習する。
実験の結果、私たちのモデルはACE05データセットでは+1.12%、SemEval 2018 Task 7.2では2.55%で最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-06-05T22:25:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。