論文の概要: Beheshti-NER: Persian Named Entity Recognition Using BERT
- arxiv url: http://arxiv.org/abs/2003.08875v1
- Date: Thu, 19 Mar 2020 15:55:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 03:40:20.086313
- Title: Beheshti-NER: Persian Named Entity Recognition Using BERT
- Title(参考訳): Beheshti-NER:BERTを用いたペルシア名のエンティティ認識
- Authors: Ehsan Taher, Seyed Abbas Hoseini, and Mehrnoush Shamsfard
- Abstract要約: 本稿では、ペルシャ語で名前付きエンティティ認識のモデルを作成するために、事前訓練された深層双方向ネットワークBERTを使用する。
その結果,83.5 と 88.4 f1 の CONLL スコアをフレーズレベルと単語レベルで評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition is a natural language processing task to recognize
and extract spans of text associated with named entities and classify them in
semantic Categories.
Google BERT is a deep bidirectional language model, pre-trained on large
corpora that can be fine-tuned to solve many NLP tasks such as question
answering, named entity recognition, part of speech tagging and etc. In this
paper, we use the pre-trained deep bidirectional network, BERT, to make a model
for named entity recognition in Persian.
We also compare the results of our model with the previous state of the art
results achieved on Persian NER. Our evaluation metric is CONLL 2003 score in
two levels of word and phrase. This model achieved second place in NSURL-2019
task 7 competition which associated with NER for the Persian language. our
results in this competition are 83.5 and 88.4 f1 CONLL score respectively in
phrase and word level evaluation.
- Abstract(参考訳): 名前付きエンティティ認識は、名前付きエンティティに関連するテキストのスパンを認識し抽出し、それらをセマンティックカテゴリに分類する自然言語処理タスクである。
Google BERTは、大きなコーパスで事前訓練されたディープ双方向言語モデルであり、質問応答、名前付きエンティティ認識、音声タグ付けなど、多くのNLPタスクを微調整することができる。
本稿では,事前学習された深層双方向ネットワークであるbertを用いて,ペルシャ語で名前付きエンティティ認識のモデルを構築する。
また,我々のモデルの結果とペルシャのNERで達成された芸術結果の先行状況を比較した。
評価基準は, CONLL 2003 の単語とフレーズの2段階のスコアである。
このモデルは、ペルシア語のNERに関連するNSURL-2019タスク7コンテストで2位を獲得した。
コンペの結果は83.5と88.4 f1 CONLLスコアで,それぞれフレーズレベルと単語レベルの評価を行った。
関連論文リスト
- A Generative Approach for Wikipedia-Scale Visual Entity Recognition [56.55633052479446]
与えられたクエリ画像をWikipediaにある600万の既存エンティティの1つにマッピングするタスクに対処する。
本稿では,対象エンティティを識別する「意味的・識別的コード」の自動復号化を学習する,新しい生成エンティティ認識フレームワークを紹介する。
論文 参考訳(メタデータ) (2024-03-04T13:47:30Z) - Multicultural Name Recognition For Previously Unseen Names [65.268245109828]
本論文は、人名の認識を改善することを目的としており、それは、誰かが生まれたり、名前を変えたりする際にも、成長できる多様なカテゴリーである。
私は103か国の名前を見て、モデルが異なる文化の名前でどれだけうまく機能するかを比較します。
文字入力と単語入力を組み合わせたモデルの方が単語のみのモデルより優れており,従来のNERモデルと比較して精度が向上する可能性がある。
論文 参考訳(メタデータ) (2024-01-23T17:58:38Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - ANEC: An Amharic Named Entity Corpus and Transformer Based Recognizer [0.0]
本稿では,条件付きランダムフィールド層を用いた双方向長短期記憶に基づくAmharicというエンティティ認識システムを提案する。
我々の名前付きエンティティ認識システムは93%のF_1スコアを達成しており、これはAmharicの名前付きエンティティ認識の新しい最先端結果である。
論文 参考訳(メタデータ) (2022-07-02T09:50:37Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - WCL-BBCD: A Contrastive Learning and Knowledge Graph Approach to Named
Entity Recognition [15.446770390648874]
WCL-BBCD (Word Contrastive Learning with BERT-BiLSTM-CRF-DBpedia)を提案する。
モデルはまずテキスト中の文ペアを訓練し、コサイン類似性により文ペア内の単語間の類似度を計算し、その類似性を通じて名前付きエンティティ認識タスクに使用されるBERTモデルを微調整する。
最後に、単語短縮による認識を緩和するため、認識結果を知識グラフなどの事前知識と組み合わせて補正する。
論文 参考訳(メタデータ) (2022-03-14T08:29:58Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Named Entity Recognition as Dependency Parsing [16.544333689188246]
グラフベースの依存性解析を使用して、バフィンモデルによる入力のグローバルビューをモデルに提供します。
このモデルは,8コーパスの評価とSoTA性能の達成により,最大2.2ポイントの精度向上を達成し,ネスト型NERと平坦型NERの両方で良好に動作することを示す。
論文 参考訳(メタデータ) (2020-05-14T17:11:41Z) - Integrating Boundary Assembling into a DNN Framework for Named Entity
Recognition in Chinese Social Media Text [3.7239227834407735]
中国語の単語境界もまたエンティティ境界であるため、中国語のテキストに対する名前付きエンティティ認識は単語境界検出の恩恵を受けることができる。
本稿では,最先端の深層ニューラルネットワークモデルと境界組立手法を統合し,その更新された単語境界情報を名前付きエンティティ認識のための条件付きランダムフィールドモデルに組み込む。
本手法は,従来の最先端結果よりも2%の絶対的な改善を示した。
論文 参考訳(メタデータ) (2020-02-27T04:29:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。