論文の概要: Neural Text Classification and StackedHeterogeneous Embeddings for Named
Entity Recognition in SMM4H 2021
- arxiv url: http://arxiv.org/abs/2106.05823v1
- Date: Thu, 10 Jun 2021 15:43:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-11 14:23:56.624877
- Title: Neural Text Classification and StackedHeterogeneous Embeddings for Named
Entity Recognition in SMM4H 2021
- Title(参考訳): SMM4H 2021における名前付きエンティティ認識のためのニューラルテキスト分類と重み付き異種埋め込み
- Authors: Usama Yaseen, Stefan Langer
- Abstract要約: 名前付きエンティティ認識(NER)とテキスト分類について検討した。
NERに対処するため,重み付き異種埋め込みと言語的特徴を用いたBiLSTM-CRFの探索を行った。
提案手法は様々な言語に一般化することができ、英語とスペイン語で有効性を示した。
- 参考スコア(独自算出の注目度): 1.195496689595016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents our findings from participating in the SMM4H Shared Task
2021. We addressed Named Entity Recognition (NER) and Text Classification. To
address NER we explored BiLSTM-CRF with Stacked Heterogeneous Embeddings and
linguistic features. We investigated various machine learning algorithms
(logistic regression, Support Vector Machine (SVM) and Neural Networks) to
address text classification. Our proposed approaches can be generalized to
different languages and we have shown its effectiveness for English and
Spanish. Our text classification submissions (team:MIC-NLP) have achieved
competitive performance with F1-score of $0.46$ and $0.90$ on ADE
Classification (Task 1a) and Profession Classification (Task 7a) respectively.
In the case of NER, our submissions scored F1-score of $0.50$ and $0.82$ on ADE
Span Detection (Task 1b) and Profession Span detection (Task 7b) respectively.
- Abstract(参考訳): 本稿では,SMM4H共有タスク2021に参加することで得られた知見について述べる。
名前付きエンティティ認識(ner)とテキスト分類について論じた。
NERに対処するため,重み付き異種埋め込みと言語機能を用いたBiLSTM-CRFの探索を行った。
テキスト分類に対処するために,さまざまな機械学習アルゴリズム(論理回帰,サポートベクトルマシン(SVM),ニューラルネットワーク)について検討した。
提案手法は様々な言語に一般化することができ、英語とスペイン語で有効性を示した。
テキスト分類出願(team:MIC-NLP)は,ADE分類(Task 1a)とProfession分類(Task 7a)でそれぞれ0.46$と0.90$のF1スコアで競合性能を達成した。
NERの場合は, ADE Span Detection (Task 1b) と Profession Span Detection (Task 7b) でそれぞれ0.50$と0.82$のF1スコアを得た。
関連論文リスト
- Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - Enhancing Pashto Text Classification using Language Processing
Techniques for Single And Multi-Label Analysis [0.0]
本研究では,Pashtoテキストの自動分類システムの構築を目的とする。
平均テスト精度は94%だった。
DistilBERTのような事前訓練された言語表現モデルの使用は、有望な結果を示した。
論文 参考訳(メタデータ) (2023-05-04T23:11:31Z) - Neural Coreference Resolution based on Reinforcement Learning [53.73316523766183]
コアレゾリューションシステムは2つのサブタスクを解決する必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクターをベースとした強化学習型ニューラルコア参照分解システムを提案する。
論文 参考訳(メタデータ) (2022-12-18T07:36:35Z) - NEAR: Named Entity and Attribute Recognition of clinical concepts [2.4278445972594525]
本研究の目的は,NERタスクを教師付き多ラベルタギング問題としてモデル化することで,エンティティとその属性を検出する領域に寄与することである。
本稿では, BiLSTM n-CRF, BiLSTM-CRF-Smax-TF, BiLSTM n-CRF-TFの3つのアーキテクチャを提案する。
我々の異なるモデルは、i2b2 2010/VAとi2b2 2012データセットでそれぞれ0.894と0.808のNER F1スコアを得る。
論文 参考訳(メタデータ) (2022-08-30T01:46:11Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - An Attention Ensemble Approach for Efficient Text Classification of
Indian Languages [0.0]
本稿では,インド・デヴァナガリ文字を母語とするマラーティー語における短文文書の細かな技術領域識別について述べる。
畳み込みニューラルネットワークが生成する中間文表現と双方向の長期記憶とを合体させ,効率的なテキスト分類を実現するcnn-bilstm注意アンサンブルモデルを提案する。
実験結果から,提案モデルが与えられたタスクにおける各種ベースライン機械学習および深層学習モデルより優れ,89.57%,f1スコア0.8875の検証精度が得られた。
論文 参考訳(メタデータ) (2021-02-20T07:31:38Z) - Arabic Speech Recognition by End-to-End, Modular Systems and Human [56.96327247226586]
我々は、エンドツーエンド変換器ASR、モジュール型HMM-DNN ASR、および人間の音声認識のための包括的なベンチマークを行う。
ASRでは、エンドツーエンドの作業が12.5%、27.5%、23.8%のWERとなり、それぞれMGB2、MGB3、MGB5の新たなパフォーマンスマイルストーンとなった。
以上の結果から,アラビア語における人的パフォーマンスは,平均3.6%のWERギャップを持つ機械に比べて,依然としてかなり優れていたことが示唆された。
論文 参考訳(メタデータ) (2021-01-21T05:55:29Z) - Explicit Alignment Objectives for Multilingual Bidirectional Encoders [111.65322283420805]
本稿では,多言語エンコーダAMBER(Aligned Multilingual Bi-directional EncodeR)の学習方法を提案する。
AMBERは、異なる粒度で多言語表現を整列する2つの明示的なアライメント目標を使用して、追加の並列データに基づいて訓練される。
実験結果から、AMBERは、シーケンスタグ付けで1.1平均F1スコア、XLMR-大規模モデル上での検索で27.3平均精度を得ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T18:34:13Z) - Relation Detection for Indonesian Language using Deep Neural Network --
Support Vector Machine [0.0]
インドネシア語の2つの名前のエンティティ間の関係検出にニューラルネットワークを用いる。
単語埋め込み、位置埋め込み、POSタグ埋め込み、文字埋め込みといった機能を使用しました。
最大の成果はF1-Scoreの0.8083で、Convolutional Layerをフロントパート、SVMをバックパートとして使用しています。
論文 参考訳(メタデータ) (2020-09-12T01:45:08Z) - NLNDE: Enhancing Neural Sequence Taggers with Attention and Noisy
Channel for Robust Pharmacological Entity Detection [11.98821166621488]
我々は,BioNLP Open Shared Tasks 2019のPharmaCoNERコンペティションの最初のサブトラックに参加したシステムについて述べる。
提案システムは,特に異なる技術を組み合わせることで,有望な結果を達成し,競争において最大88.6%のF1に達する。
論文 参考訳(メタデータ) (2020-07-02T11:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。