論文の概要: Self-Attention Gazetteer Embeddings for Named-Entity Recognition
- arxiv url: http://arxiv.org/abs/2004.04060v2
- Date: Sat, 18 Apr 2020 14:16:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 08:55:23.760690
- Title: Self-Attention Gazetteer Embeddings for Named-Entity Recognition
- Title(参考訳): 名前付きエンティティ認識のための自己注意型ガゼッタ埋め込み
- Authors: Stanislav Peshterliev, Christophe Dupuy, Imre Kiss
- Abstract要約: GazSelfAttnは、自己アテンションとマッチスパンエンコーディングを使用して、拡張されたガゼテア埋め込みを構築する新しいガゼテア埋め込みアプローチである。
我々は、オープンソースのWikidataナレッジベースから、ガゼッタリソースを構築する方法を実証する。
- 参考スコア(独自算出の注目度): 3.6138359403454854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent attempts to ingest external knowledge into neural models for
named-entity recognition (NER) have exhibited mixed results. In this work, we
present GazSelfAttn, a novel gazetteer embedding approach that uses
self-attention and match span encoding to build enhanced gazetteer embeddings.
In addition, we demonstrate how to build gazetteer resources from the open
source Wikidata knowledge base. Evaluations on CoNLL-03 and Ontonotes 5
datasets, show F1 improvements over baseline model from 92.34 to 92.86 and
89.11 to 89.32 respectively, achieving performance comparable to large
state-of-the-art models.
- Abstract(参考訳): 近年、NER(Nond-entity Recognition)のためのニューラルモデルに外部知識を取り入れようとする試みが混在している。
本稿では,gazselfattnについて述べる。gazselfattnは,セルフアテンションとマッチスパンエンコーディングを用いた,新たなガゼッタ埋め込み手法である。
さらに,オープンソースのWikidataナレッジベースからガゼッタリソースを構築する方法についても紹介する。
CoNLL-03とOntonotes 5データセットの評価では、ベースラインモデルを92.34から92.86に、89.11から89.32に改善し、大きな最先端モデルに匹敵するパフォーマンスを達成した。
関連論文リスト
- ExaRanker-Open: Synthetic Explanation for IR using Open-Source LLMs [60.81649785463651]
ExaRanker-Openを導入し、オープンソース言語モデルを適用して、説明を生成する。
以上の結果から,LLMのサイズが大きくなるにつれて,説明の組み込みが神経ランク付けを継続的に促進することが明らかとなった。
論文 参考訳(メタデータ) (2024-02-09T11:23:14Z) - Software Metadata Classification based on Generative Artificial
Intelligence [0.0]
本稿では、生成人工知能(AI)を用いたバイナリコードコメント品質分類モデルの性能向上のための新しいアプローチを提案する。
OpenAI APIを活用することで、新たに生成した1239のコード補完ペアからなるデータセットを、“Useful”あるいは“Not Useful”とラベル付けした。
その結果,ソフトウェア開発分野や品質保証分野の幅広い文脈における適用性を示すとともに,本手法の有効性を確認した。
論文 参考訳(メタデータ) (2023-10-14T07:38:16Z) - Preserving Knowledge Invariance: Rethinking Robustness Evaluation of
Open Information Extraction [50.62245481416744]
実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。
我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。
さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文 参考訳(メタデータ) (2023-05-23T12:05:09Z) - Generation of Highlights from Research Papers Using Pointer-Generator
Networks and SciBERT Embeddings [5.095525589147811]
我々は,入力トークンをSciBERT埋め込みにエンコードする入力に,カバレッジ機構を備えたポインタジェネレータネットワークとコンテキスト埋め込み層を用いる。
我々は、ベンチマークデータセットCSPubSumでモデルをテストし、また、自動研究ハイライト生成のための新しい論文の多分野コーパスであるMixSubを提示する。
論文 参考訳(メタデータ) (2023-02-14T12:45:14Z) - Rethinking the Value of Gazetteer in Chinese Named Entity Recognition [34.8877220568968]
筆者らはまず, ガゼッタ強化NERモデルのいくつかの共通プラクティスの有効性を再検討した。
次に,モデル性能とガゼッタ特性の関係を評価するために,一連の詳細な解析を行った。
論文 参考訳(メタデータ) (2022-07-06T16:45:25Z) - Modeling Multi-Granularity Hierarchical Features for Relation Extraction [26.852869800344813]
本稿では,原文のみに基づく多粒度特徴抽出手法を提案する。
外部知識を必要とせずに,効果的な構造的特徴が達成可能であることを示す。
論文 参考訳(メタデータ) (2022-04-09T09:44:05Z) - FRUIT: Faithfully Reflecting Updated Information in Text [106.40177769765512]
FRUIT(FruIT)で更新情報を反映した新しい生成タスクについて紹介する。
我々の分析は、記事の更新が可能なモデルを開発するには、ニューラルジェネレーションモデルに新しい能力が必要であることを示している。
論文 参考訳(メタデータ) (2021-12-16T05:21:24Z) - AutoTriggER: Label-Efficient and Robust Named Entity Recognition with
Auxiliary Trigger Extraction [54.20039200180071]
我々は,エンティティトリガの自動生成と活用によるNER性能向上のための新しいフレームワークを提案する。
筆者らのフレームワークは,ポストホックな説明を活用して合理的な知識を生成し,埋め込み手法を用いてモデルの事前知識を強化する。
AutoTriggERは強力なラベル効率を示し、目に見えないエンティティを一般化し、RoBERTa-CRFベースラインを平均0.5F1ポイント上回る性能を持つ。
論文 参考訳(メタデータ) (2021-09-10T08:11:56Z) - Federated Knowledge Graphs Embedding [50.35484170815679]
本稿では,fkge(federated knowledge graphs embedded)という分散スケーラブル学習フレームワークを提案する。
FKGEは、知識グラフのペア間の逆生成を利用して、異なるドメインの同一の実体と関係を近接埋め込み空間に変換する。
トレーニングデータのプライバシーを保護するために、FKGEはさらにプライバシー保護ニューラルネットワーク構造を実装し、生データの漏洩を保証しません。
論文 参考訳(メタデータ) (2021-05-17T05:30:41Z) - Soft Gazetteers for Low-Resource Named Entity Recognition [78.00856159473393]
本稿では、英語知識ベースからユビキタスに利用可能な情報をニューラル名付きエンティティ認識モデルに組み込む「ソフトガゼッタ」を提案する。
4つの低リソース言語に対する実験により,F1得点の4点の平均的改善が示された。
論文 参考訳(メタデータ) (2020-05-04T21:58:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。