論文の概要: NSURL-2019 Task 7: Named Entity Recognition (NER) in Farsi
- arxiv url: http://arxiv.org/abs/2003.09029v1
- Date: Thu, 19 Mar 2020 22:09:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 04:15:06.898123
- Title: NSURL-2019 Task 7: Named Entity Recognition (NER) in Farsi
- Title(参考訳): NSURL-2019 Task 7: Named Entity Recognition (NER) in Farsi
- Authors: Nasrin Taghizadeh, Zeinab Borhanifard, Melika GolestaniPour, Heshaam
Faili
- Abstract要約: 本稿では,トレーニングとテストデータ作成のプロセス,参加チーム(6チーム)のリスト,システム評価結果について述べる。
F1スコアの85.4%は、人、組織、場所、日付、時間、お金、パーセンテージを含む7つの学級におけるフレーズレベルの評価に基づいて得られた。
- 参考スコア(独自算出の注目度): 0.7742297876120561
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: NSURL-2019 Task 7 focuses on Named Entity Recognition (NER) in Farsi. This
task was chosen to compare different approaches to find phrases that specify
Named Entities in Farsi texts, and to establish a standard testbed for future
researches on this task in Farsi. This paper describes the process of making
training and test data, a list of participating teams (6 teams), and evaluation
results of their systems. The best system obtained 85.4% of F1 score based on
phrase-level evaluation on seven classes of NEs including person, organization,
location, date, time, money and percent.
- Abstract(参考訳): NSURL-2019 Task 7は、Farsiにおける名前付きエンティティ認識(NER)に焦点を当てている。
このタスクは、farsiテキストで名前付きエンティティを指定するフレーズを見つけるための異なるアプローチを比較し、farsiでこのタスクに関する将来の研究のための標準テストベッドを確立するために選択された。
本稿では,トレーニングとテストデータ作成のプロセス,参加チーム(6チーム)のリスト,システム評価結果について述べる。
F1スコアの85.4%は、人、組織、場所、日付、時間、お金、パーセンテージを含む7つの学級におけるフレーズレベルの評価に基づいて得られた。
関連論文リスト
- A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - SemEval 2024 -- Task 10: Emotion Discovery and Reasoning its Flip in
Conversation (EDiReF) [61.49972925493912]
SemEval-2024 Task 10は、コードミキシングされた対話における感情の識別に焦点を当てた共有タスクである。
このタスクは3つの異なるサブタスクから構成される - コードミックス対話のための会話における感情認識、コードミックス対話のための感情フリップ推論、および英語対話のための感情フリップ推論である。
このタスクには84人の参加者が参加し、各サブタスクのF1スコアは0.70、0.79、0.76に達した。
論文 参考訳(メタデータ) (2024-02-29T08:20:06Z) - SEAHORSE: A Multilingual, Multifaceted Dataset for Summarization
Evaluation [52.186343500576214]
本稿では,多言語・多面的要約評価のためのデータセットSEAHORSEを紹介する。
SEAHORSEは、テキスト品質の6次元に沿って人間格付けされた96Kの要約で構成されている。
本稿では,SEAHORSEでトレーニングしたメトリクスが,ドメイン外メタ評価ベンチマークTRUEとmFACEで高い性能を示すことを示す。
論文 参考訳(メタデータ) (2023-05-22T16:25:07Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - The Eval4NLP Shared Task on Explainable Quality Estimation: Overview and
Results [20.15825350326367]
ソース変換ペアが与えられた場合、このタスクは、翻訳の全体的な品質を示す文レベルスコアを提供するだけでなく、翻訳品質に悪影響を及ぼす単語を識別することで、このスコアを説明する必要がある。
共有タスクのデータ, ガイドライン, 評価設定を提示し, 6つのシステムについて記述し, 結果を分析した。
論文 参考訳(メタデータ) (2021-10-08T21:57:08Z) - Neural Text Classification and Stacked Heterogeneous Embeddings for
Named Entity Recognition in SMM4H 2021 [1.195496689595016]
名前付きエンティティ認識(NER)とテキスト分類について検討した。
NERに対処するため,重み付き異種埋め込みと言語的特徴を用いたBiLSTM-CRFの探索を行った。
提案手法は様々な言語に一般化することができ、英語とスペイン語で有効性を示した。
論文 参考訳(メタデータ) (2021-06-10T15:43:21Z) - Combining Context-Free and Contextualized Representations for Arabic
Sarcasm Detection and Sentiment Identification [0.0]
本論文では,SPPU-AASM チームによる WANLP ArSarcasm shared-task 2021 の提出を示唆する。
提案方式は, 皮肉および感情検出タスクに対して, F1-sarcastic score の 0.62 と F-PN score の 0.715 をそれぞれ達成する。
論文 参考訳(メタデータ) (2021-03-09T19:39:43Z) - An Attention Ensemble Approach for Efficient Text Classification of
Indian Languages [0.0]
本稿では,インド・デヴァナガリ文字を母語とするマラーティー語における短文文書の細かな技術領域識別について述べる。
畳み込みニューラルネットワークが生成する中間文表現と双方向の長期記憶とを合体させ,効率的なテキスト分類を実現するcnn-bilstm注意アンサンブルモデルを提案する。
実験結果から,提案モデルが与えられたタスクにおける各種ベースライン機械学習および深層学習モデルより優れ,89.57%,f1スコア0.8875の検証精度が得られた。
論文 参考訳(メタデータ) (2021-02-20T07:31:38Z) - Interpretability Analysis for Named Entity Recognition to Understand
System Predictions and How They Can Improve [49.878051587667244]
名前付きエンティティ認識のためのLSTM-CRFアーキテクチャの性能について検討する。
文脈表現はシステムの性能に寄与するが、ハイパフォーマンスを駆動する主な要因は、名前トークン自体を学習することにある。
我々は、コンテキストのみからエンティティタイプを推測する可能性を評価するために、人間アノテーションを登録し、コンテキストのみのシステムによるエラーの大部分に対してエンティティタイプを推論することはできないが、改善の余地はいくつかある。
論文 参考訳(メタデータ) (2020-04-09T14:37:12Z) - Beheshti-NER: Persian Named Entity Recognition Using BERT [0.0]
本稿では、ペルシャ語で名前付きエンティティ認識のモデルを作成するために、事前訓練された深層双方向ネットワークBERTを使用する。
その結果,83.5 と 88.4 f1 の CONLL スコアをフレーズレベルと単語レベルで評価した。
論文 参考訳(メタデータ) (2020-03-19T15:55:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。