論文の概要: Parallel sequence tagging for concept recognition
- arxiv url: http://arxiv.org/abs/2003.07424v2
- Date: Sat, 8 Aug 2020 07:54:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 02:57:38.320387
- Title: Parallel sequence tagging for concept recognition
- Title(参考訳): 概念認識のための並列シーケンスタグ付け
- Authors: Lenz Furrer (1 and 3), Joseph Cornelius (1), Fabio Rinaldi (1, 2, and
3) ((1) University of Zurich, Switzerland, (2) Dalle Molle Institute for
Artificial Intelligence Research (IDSIA), Switzerland, (3) Swiss Institute of
Bioinformatics, Switzerland)
- Abstract要約: 名前付きエンティティ認識(NER)と正規化(NEN)は、バイオメディカルテキストのためのあらゆるテキストマイニングシステムの中核となるコンポーネントである。
従来の概念認識パイプラインでは、これらのタスクはシリアルな方法で結合される。
我々は,NER と NEN の両方をシーケンスラベルタスクとしてモデル化し,ソースコードを直接操作する並列アーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: Named Entity Recognition (NER) and Normalisation (NEN) are core
components of any text-mining system for biomedical texts. In a traditional
concept-recognition pipeline, these tasks are combined in a serial way, which
is inherently prone to error propagation from NER to NEN. We propose a parallel
architecture, where both NER and NEN are modeled as a sequence-labeling task,
operating directly on the source text. We examine different harmonisation
strategies for merging the predictions of the two classifiers into a single
output sequence. Results: We test our approach on the recent Version 4 of the
CRAFT corpus. In all 20 annotation sets of the concept-annotation task, our
system outperforms the pipeline system reported as a baseline in the CRAFT
shared task 2019. Conclusions: Our analysis shows that the strengths of the two
classifiers can be combined in a fruitful way. However, prediction
harmonisation requires individual calibration on a development set for each
annotation set. This allows achieving a good trade-off between established
knowledge (training set) and novel information (unseen concepts). Availability
and Implementation: Source code freely available for download at
https://github.com/OntoGene/craft-st. Supplementary data are available at arXiv
online.
- Abstract(参考訳): 背景: 名前付きエンティティ認識(ner)と正規化(nen)は、生物医学的テキストのテキストマイニングシステムの中核コンポーネントである。
従来の概念認識パイプラインでは、これらのタスクは連続的な方法で結合される。
我々は,NER と NEN の両方をシーケンスラベルタスクとしてモデル化し,ソースコードを直接操作する並列アーキテクチャを提案する。
2つの分類器の予測を1つの出力シーケンスにマージするための異なる調和戦略を検討する。
結果:最新の CRAFT コーパスのバージョン4 では,我々のアプローチを検証した。
概念アノテーションタスクの20のアノテーションセットすべてにおいて、このシステムはcraft shared task 2019のベースラインとして報告されたパイプラインシステムよりも優れています。
結論: 分析の結果, 2つの分類器の強みは実りある方法で結合できることがわかった。
しかし、予測調和には各アノテーションセットの開発セットに対する個別のキャリブレーションが必要である。
これにより、確立された知識(訓練セット)と新しい情報(見当たらない概念)の間の良いトレードオフを実現することができる。
可用性と実装:ソースコードはhttps://github.com/ontogene/craft-stから無料でダウンロードできる。
補足データはarxiv onlineで入手できる。
関連論文リスト
- Scalable Learning of Latent Language Structure With Logical Offline
Cycle Consistency [71.42261918225773]
概念的には、LOCCOは、トレーニング対象のセマンティクスを使用してラベルなしテキストのアノテーションを生成する、自己学習の一形態と見なすことができる。
追加ボーナスとして、LOCCOによって生成されたアノテーションは、神経テキスト生成モデルをトレーニングするために自明に再利用することができる。
論文 参考訳(メタデータ) (2023-05-31T16:47:20Z) - Enhancing Few-shot NER with Prompt Ordering based Data Augmentation [59.69108119752584]
本稿では,PODA(Prompt Ordering Based Data Augmentation)手法を提案する。
3つのパブリックNERデータセットの実験結果とさらなる分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-19T16:25:43Z) - Hybrid Rule-Neural Coreference Resolution System based on Actor-Critic
Learning [53.73316523766183]
コアレゾリューションシステムは2つの主要なタスクに取り組む必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクター・クリティカル・ラーニングに基づく複合ルール・ニューラル・コア参照解決システムを提案する。
論文 参考訳(メタデータ) (2022-12-20T08:55:47Z) - Neural Coreference Resolution based on Reinforcement Learning [53.73316523766183]
コアレゾリューションシステムは2つのサブタスクを解決する必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクターをベースとした強化学習型ニューラルコア参照分解システムを提案する。
論文 参考訳(メタデータ) (2022-12-18T07:36:35Z) - Knowledge Graph Generation From Text [18.989264255589806]
そこで本研究では,テキスト入力から新たなエンド・ツー・エンドの知識グラフ(KG)生成システムを提案する。
グラフノードは、まず事前訓練された言語モデルを用いて生成され、次に単純なエッジ構築ヘッドが続く。
我々は,最新のWebNLG 2020 Challengeデータセットを用いて,テキストからRDF生成タスクにおける最先端のパフォーマンスとを一致させたモデルの評価を行った。
論文 参考訳(メタデータ) (2022-11-18T21:27:13Z) - Training Free Graph Neural Networks for Graph Matching [103.45755859119035]
TFGMは、グラフニューラルネットワーク(GNN)ベースのグラフマッチングのパフォーマンスをトレーニングなしで向上するフレームワークである。
TFGMをさまざまなGNNに適用することは、ベースラインよりも有望な改善を示している。
論文 参考訳(メタデータ) (2022-01-14T09:04:46Z) - Boosting Span-based Joint Entity and Relation Extraction via Squence
Tagging Mechanism [10.894755638322]
Spanベースの関節抽出は、テキストスパン形式で名前付きエンティティ認識(NER)と関係抽出(RE)を同時に行う。
近年の研究では、トークンラベルは重要なタスク固有の情報を伝達し、トークンのセマンティクスを豊かにすることができることが示されている。
本稿では,Span-based Network(STSN)を提案する。これはSpan-based joint extrac-tion Networkで,トークンBIOラベル情報によって拡張されている。
論文 参考訳(メタデータ) (2021-05-21T01:10:03Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。