論文の概要: NLNDE: Enhancing Neural Sequence Taggers with Attention and Noisy
Channel for Robust Pharmacological Entity Detection
- arxiv url: http://arxiv.org/abs/2007.01022v1
- Date: Thu, 2 Jul 2020 11:17:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 13:07:28.196651
- Title: NLNDE: Enhancing Neural Sequence Taggers with Attention and Noisy
Channel for Robust Pharmacological Entity Detection
- Title(参考訳): nlnde:ロバストな薬理学的実体検出のための注意とノイズチャンネルによる神経配列タガーの増強
- Authors: Lukas Lange, Heike Adel, Jannik Str\"otgen
- Abstract要約: 我々は,BioNLP Open Shared Tasks 2019のPharmaCoNERコンペティションの最初のサブトラックに参加したシステムについて述べる。
提案システムは,特に異なる技術を組み合わせることで,有望な結果を達成し,競争において最大88.6%のF1に達する。
- 参考スコア(独自算出の注目度): 11.98821166621488
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition has been extensively studied on English news texts.
However, the transfer to other domains and languages is still a challenging
problem. In this paper, we describe the system with which we participated in
the first subtrack of the PharmaCoNER competition of the BioNLP Open Shared
Tasks 2019. Aiming at pharmacological entity detection in Spanish texts, the
task provides a non-standard domain and language setting. However, we propose
an architecture that requires neither language nor domain expertise. We treat
the task as a sequence labeling task and experiment with attention-based
embedding selection and the training on automatically annotated data to further
improve our system's performance. Our system achieves promising results,
especially by combining the different techniques, and reaches up to 88.6% F1 in
the competition.
- Abstract(参考訳): 名前付きエンティティ認識は、英語のニューステキストで広く研究されている。
しかし、他のドメインや言語への移行は依然として難しい問題である。
本稿では,BioNLP Open Shared Tasks 2019のPharmaCoNERコンペティションの最初のサブトラックに参加したシステムについて述べる。
スペイン語のテキストにおける薬理学的エンティティ検出を目的としたこのタスクは、非標準ドメインと言語設定を提供する。
しかし、言語やドメインの専門知識を必要としないアーキテクチャを提案する。
タスクをシーケンスラベリングタスクとして扱い,注意に基づく埋め込み選択と自動アノテートデータのトレーニングを行い,システムの性能をさらに向上させる。
提案システムは,特に異なる技術を組み合わせることで,有望な結果を達成し,競争において最大88.6%のF1に達する。
関連論文リスト
- IITK at SemEval-2024 Task 1: Contrastive Learning and Autoencoders for Semantic Textual Relatedness in Multilingual Texts [4.78482610709922]
本稿では,SemEval-2024 Task 1: Semantic Textual Relatednessについて述べる。
この課題は、14言語における文のペア間の関連度を自動的に検出することに焦点を当てている。
論文 参考訳(メタデータ) (2024-04-06T05:58:42Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - Addressing Issues of Cross-Linguality in Open-Retrieval Question
Answering Systems For Emergent Domains [67.99403521976058]
新型コロナウイルスの緊急ドメインに対する言語横断的オープン検索型質問応答システムについて紹介する。
本システムでは,検索した文書の信頼性を確保するために,学術論文のコーパスを採用している。
深いセマンティック・レトリバーは、我々の英語からすべてのデータに対するトレーニングの恩恵が大きく、言語横断環境ではBM25ベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-01-26T19:27:32Z) - Chemical Identification and Indexing in PubMed Articles via BERT and
Text-to-Text Approaches [3.7462395049372894]
Biocreative VII Track-2 チャレンジは、名前付きエンティティ認識、エンティティリンク(またはエンティティ正規化)、トピックインデックスタスクで構成される。
BERTベースのBioMegatronモデルで最高の性能を得る。
従来のNER法に加えて,新しいテキスト・トゥ・テキストや「プロンプト」をベースとした手法を用いて,名前付きエンティティ認識とエンティティリンクを試みている。
論文 参考訳(メタデータ) (2021-11-30T18:21:06Z) - Learning Domain-Specialised Representations for Cross-Lingual Biomedical
Entity Linking [66.76141128555099]
言語横断型バイオメディカルエンティティリンクタスク(XL-BEL)を提案する。
まず、標準単言語英語BELタスクを超えて、標準単言語および多言語LMと同様に、標準的な知識に依存しない能力について検討する。
次に、リソースに富んだ言語からリソースに乏しい言語にドメイン固有の知識を移すことの課題に対処する。
論文 参考訳(メタデータ) (2021-05-30T00:50:00Z) - Domain-Specific Language Model Pretraining for Biomedical Natural
Language Processing [73.37262264915739]
バイオメディシンなどのラベルなしテキストの少ないドメインでは、スクラッチから言語モデルを事前学習することで、かなりの利益が得られることを示す。
実験の結果, ドメイン固有のプレトレーニングは, 幅広い生物医学的NLPタスクの基盤となることが明らかとなった。
論文 参考訳(メタデータ) (2020-07-31T00:04:15Z) - NLNDE: The Neither-Language-Nor-Domain-Experts' Way of Spanish Medical
Document De-Identification [11.98821166621488]
我々は,MEDDOCANコンペティションに参加したNLNDEシステムについて述べる。
スペインのデータから保護された健康情報を検出し分類する課題に対処する。
非標準言語とドメイン設定を扱うにもかかわらず、NLNDEシステムは競争において有望な結果を達成する。
論文 参考訳(メタデータ) (2020-07-02T11:30:32Z) - Data Mining in Clinical Trial Text: Transformers for Classification and
Question Answering Tasks [2.127049691404299]
本研究は,医学的テキストに基づくエビデンス合成に自然言語処理の進歩を適用した。
主な焦点は、Population、Intervention、Comparator、Outcome(PICO)フレームワークを通じて特徴づけられる情報である。
トランスフォーマーに基づく最近のニューラルネットワークアーキテクチャは、トランスファーラーニングの能力を示し、下流の自然言語処理タスクのパフォーマンスが向上している。
論文 参考訳(メタデータ) (2020-01-30T11:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。