論文の概要: SynSetExpan: An Iterative Framework for Joint Entity Set Expansion and
Synonym Discovery
- arxiv url: http://arxiv.org/abs/2009.13827v1
- Date: Tue, 29 Sep 2020 07:32:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 05:18:19.906994
- Title: SynSetExpan: An Iterative Framework for Joint Entity Set Expansion and
Synonym Discovery
- Title(参考訳): synsetexpan:ジョイントエンティティ集合の拡張と同義語発見のための反復的フレームワーク
- Authors: Jiaming Shen and Wenda Qiu and Jingbo Shang and Michelle Vanni and
Xiang Ren and Jiawei Han
- Abstract要約: SynSetExpanは2つのタスクを相互に拡張できる新しいフレームワークである。
クラウドソーシングによる最初の大規模Synonym-Enhanced Set Expansionデータセットを作成する。
SE2データセットと以前のベンチマークの実験では、エンティティセットの拡張と同義語発見タスクの両方においてSynSetExpanの有効性が示されている。
- 参考スコア(独自算出の注目度): 66.24624547470175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity set expansion and synonym discovery are two critical NLP tasks.
Previous studies accomplish them separately, without exploring their
interdependencies. In this work, we hypothesize that these two tasks are
tightly coupled because two synonymous entities tend to have similar
likelihoods of belonging to various semantic classes. This motivates us to
design SynSetExpan, a novel framework that enables two tasks to mutually
enhance each other. SynSetExpan uses a synonym discovery model to include
popular entities' infrequent synonyms into the set, which boosts the set
expansion recall. Meanwhile, the set expansion model, being able to determine
whether an entity belongs to a semantic class, can generate pseudo training
data to fine-tune the synonym discovery model towards better accuracy. To
facilitate the research on studying the interplays of these two tasks, we
create the first large-scale Synonym-Enhanced Set Expansion (SE2) dataset via
crowdsourcing. Extensive experiments on the SE2 dataset and previous benchmarks
demonstrate the effectiveness of SynSetExpan for both entity set expansion and
synonym discovery tasks.
- Abstract(参考訳): エンティティセット拡張と同義語発見は2つの重要なNLPタスクである。
以前の研究は、相互依存を探求することなく、それらを個別に達成している。
本研究では、2つの同義体が様々な意味クラスに属する可能性を持つ傾向があるため、これらの2つのタスクは密結合していると仮定する。
これは2つのタスクを相互に拡張できる新しいフレームワークであるSynSetExpanを設計する動機となります。
SynSetExpanは、一般的なエンティティの頻度の低い同義語をセットに含めるために、同義語発見モデルを使用している。
一方、エンティティがセマンティッククラスに属しているかどうかを判断できる設定拡張モデルは、擬似トレーニングデータを生成し、同義語発見モデルを精度良く微調整することができる。
これら2つのタスクの相互作用の研究を容易にするために,クラウドソーシングによる最初の大規模Synonym-Enhanced Set Expansion(SE2)データセットを作成する。
se2データセットと以前のベンチマークに関する広範な実験は、エンティティセットの拡張とシノニム発見タスクの両方におけるsynsetexpanの有効性を示している。
関連論文リスト
- Dual Encoder: Exploiting the Potential of Syntactic and Semantic for
Aspect Sentiment Triplet Extraction [19.375196127313348]
Aspect Sentiment Triple extract (ASTE) は、微粒な感情分析における新たな課題である。
本稿では,BERTチャネルによる意味情報をキャプチャするデュアルチャネルエンコーダと,総合構文情報キャプチャのための拡張LSTMチャネルを提案する。
我々はこれらのモジュールのシナジーを活用して、ASTEタスクにおける構文情報と意味情報の重要な可能性を活用する。
論文 参考訳(メタデータ) (2024-02-23T15:07:13Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - GDA: Generative Data Augmentation Techniques for Relation Extraction
Tasks [81.51314139202152]
本稿では,意味的一貫性と構文構造を両立させるために2つの相補的モジュールを用いるGDAという,関係テキスト専用の拡張手法を提案する。
低リソース環境下での3つのデータセットによる実験結果から,GDAはエム2.0%のF1改善をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-26T06:21:01Z) - Iteratively Improving Biomedical Entity Linking and Event Extraction via
Hard Expectation-Maximization [9.422435686239538]
バイオメディカル・エンティティ・リンクとイベント抽出は、バイオメディカル・ドメインにおけるテキストの理解と検索を支援する2つの重要なタスクである。
従来の研究は通常、これらの2つのタスクを別々に、あるいはパイプラインで解決し、エラーの伝播につながる。
本稿では,知識ベースにおけるイベント構造とエンティティ参照を潜伏変数として扱うことで,共同生物医学的実体リンクとイベント抽出を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:30:31Z) - From Alignment to Entailment: A Unified Textual Entailment Framework for
Entity Alignment [17.70562397382911]
既存のメソッドは通常、エンティティのトリプルを埋め込みとしてエンコードし、埋め込みの整列を学ぶ。
我々は両トリプルを統一されたテキストシーケンスに変換し、EAタスクを双方向のテキストエンタテインメントタスクとしてモデル化する。
提案手法は,エンティティ間の2種類の情報の統合相関パターンを捕捉し,元のエンティティ情報間のきめ細かい相互作用を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-05-19T08:06:50Z) - KGSynNet: A Novel Entity Synonyms Discovery Framework with Knowledge
Graph [23.053995137917994]
emphKGSynNetという新しいエンティティ同義語発見フレームワークを提案する。
具体的には、大規模なドメイン固有コーパスを用いて、参照やエンティティのサブワード埋め込みを事前訓練する。
固有設計のエンフュージョンゲートを用いて、エンティティの知識情報をセマンティックな特徴に適応的に吸収する。
論文 参考訳(メタデータ) (2021-03-16T07:32:33Z) - A Co-Interactive Transformer for Joint Slot Filling and Intent Detection [61.109486326954205]
音声言語理解システム(SLU)を構築する上では,インテント検出とスロットフィリングが主要な2つのタスクである。
以前の研究では、2つのタスクを個別にモデル化するか、インテントからスロットへの単一の情報フローのみを考慮していた。
本稿では,2つのタスク間の相互影響を同時に検討するコ・インターアクティブ・トランスフォーマーを提案する。
論文 参考訳(メタデータ) (2020-10-08T10:16:52Z) - Empower Entity Set Expansion via Language Model Probing [58.78909391545238]
既存の拡張方法は、コンテキスト特徴を適応的に選択し、新しいエンティティを抽出することで、シードエンティティをブートストラップする。
エンティティセット拡張の鍵となる課題は、クラスセマンティクスをシフトし、後のイテレーションで累積エラーにつながる曖昧なコンテキスト機能を選択することを避けることである。
セマンティックドリフト問題に対処するために、自動生成されたクラス名を活用する新しい反復的集合拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-29T00:09:43Z) - CASE: Context-Aware Semantic Expansion [68.30244980290742]
本稿では,CASE(Context-Aware Semantic Expansion)と呼ばれる新しいタスクを定義し,検討する。
セマンティックな文脈でシード項が与えられた場合、その文脈に適した他の用語をシードとして提案することを目指している。
このタスクのアノテーションは,既存のコーパスから完全に自動で,大規模に抽出可能であることを示す。
論文 参考訳(メタデータ) (2019-12-31T06:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。