論文の概要: CLaC at SemEval-2023 Task 2: Comparing Span-Prediction and
Sequence-Labeling approaches for NER
- arxiv url: http://arxiv.org/abs/2305.03845v1
- Date: Fri, 5 May 2023 20:49:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 19:14:25.626174
- Title: CLaC at SemEval-2023 Task 2: Comparing Span-Prediction and
Sequence-Labeling approaches for NER
- Title(参考訳): SemEval-2023 Task 2におけるCLaC: NERにおけるSpan-PredictionとSequence-Labelingの比較
- Authors: Harsh Verma, Sabine Bergler
- Abstract要約: 本稿では,MultiCoNER 2タスクに対するCLaC提案を要約する。
NERの2つの一般的なアプローチ、すなわちSequence LabelingとSpan Predictionを比較した。
テストデータ上での最高のシーケンスラベリングシステムよりも,最高のSpan予測システムの方が若干パフォーマンスがよいことが分かりました。
- 参考スコア(独自算出の注目度): 0.554780083433538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper summarizes the CLaC submission for the MultiCoNER 2 task which
concerns the recognition of complex, fine-grained named entities. We compare
two popular approaches for NER, namely Sequence Labeling and Span Prediction.
We find that our best Span Prediction system performs slightly better than our
best Sequence Labeling system on test data. Moreover, we find that using the
larger version of XLM RoBERTa significantly improves performance.
Post-competition experiments show that Span Prediction and Sequence Labeling
approaches improve when they use special input tokens (<s> and </s>) of
XLM-RoBERTa. The code for training all models, preprocessing, and
post-processing is available at
https://github.com/harshshredding/semeval2023-multiconer-paper.
- Abstract(参考訳): 本稿では、複雑できめ細かい名前を持つエンティティの認識に関するMultiCoNER 2タスクに対するCLaC提案を要約する。
NERの2つの一般的なアプローチ、すなわちSequence LabelingとSpan Predictionを比較した。
ベストスパン予測システムはテストデータ上の最良のシーケンスラベリングシステムよりも若干優れていることが分かりました。
さらに,XLM RoBERTaの大型バージョンを使用することで性能が大幅に向上することがわかった。
比較実験の結果,XLM-RoBERTaの特別な入力トークン(<s>, </s>)を使用する場合, Span Prediction と Sequence Labeling のアプローチは改善することがわかった。
すべてのモデル、前処理、後処理をトレーニングするコードは、https://github.com/harshshredding/semeval2023-multiconer-paperで入手できる。
関連論文リスト
- A Debiased Nearest Neighbors Framework for Multi-Label Text Classification [13.30576550077694]
マルチラベルテキスト分類(MLTC)のためのDebiased Nearest Neighbors(DENN)フレームワークについて紹介する。
組込みアライメントバイアスに対処するために,ラベル共起における近傍の一貫性を向上する,非バイアス付きコントラスト学習戦略を提案する。
信頼度推定バイアスには,$k$NNの予測と帰納的二分分類の適応的組み合わせを改善し,偏りのある信頼度推定戦略を提案する。
論文 参考訳(メタデータ) (2024-08-06T14:00:23Z) - OTSeq2Set: An Optimal Transport Enhanced Sequence-to-Set Model for
Extreme Multi-label Text Classification [9.990725102725916]
XMTC (Extreme Multi-label text classification) は、大規模ラベルコレクションから最も関連性の高いサブセットラベルを見つけるタスクである。
OTSeq2Set という名前の XMTC タスクに対する自己回帰シーケンス・ツー・セットモデルを提案する。
本モデルは,学生強制スキームにおける予測を生成し,両部マッチングに基づく損失関数を用いて学習する。
論文 参考訳(メタデータ) (2022-10-26T07:25:18Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Post-OCR Document Correction with large Ensembles of Character Sequence
Models [0.3359875577705537]
光学文字認識(OCR)システムですでに処理されている文書を補正する新しい手法を提案する。
本論文の主な貢献は,文字列を正確に処理する戦略の集合である。
我々は,ICDAR 2019コンペティションの9言語を対象に,OCR後のテキスト修正を行い,その中5言語で新たな最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T19:05:02Z) - Enhancing Label Correlation Feedback in Multi-Label Text Classification
via Multi-Task Learning [6.1538971100140145]
ラベル相関フィードバックを高めるために,マルチタスク学習を用いた新しい手法を提案する。
本稿では,ラベル相関学習を強化するための2つの補助ラベル共起予測タスクを提案する。
論文 参考訳(メタデータ) (2021-06-06T12:26:14Z) - SpanNer: Named Entity Re-/Recognition as Span Prediction [62.66148736099347]
スパン予測モデルは名前付きエンティティ認識に使用される。
我々は11のデータセットに154のシステムを実験的に実装し、3つの言語をカバーした。
私たちのモデルはExplainaBoardプラットフォームにデプロイされました。
論文 参考訳(メタデータ) (2021-06-01T17:11:42Z) - Accelerating BERT Inference for Sequence Labeling via Early-Exit [65.7292767360083]
我々は最近成功した早期退避機構を拡張し、シークエンスラベリングタスクに対するPTMの推論を高速化する。
また、異なる層で部分トークンを早期に退避させるトークンレベルの早期退避機構も提案する。
当社のアプローチでは,パフォーマンスの低下を最小限に抑えながら,最大66%~75%の推論コストを削減できる。
論文 参考訳(メタデータ) (2021-05-28T14:39:26Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - NLRG at SemEval-2021 Task 5: Toxic Spans Detection Leveraging BERT-based
Token Classification and Span Prediction Techniques [0.6850683267295249]
本稿では,トークン分類やスパン予測手法の簡易バージョンについて検討する。
どちらのアプローチにもBERT、RoBERTa、SpanBERTといったBERTベースのモデルを使用します。
そこで本研究では,Multi-Span,Span+Token,LSTM-CRFの4つのハイブリッド手法と,ユニオン/インターセクションを用いた予測オフセットの組み合わせについて検討する。
論文 参考訳(メタデータ) (2021-02-24T12:30:09Z) - BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant
Supervision [49.42215511723874]
我々は,NERモデルの予測性能を改善するための新しい計算フレームワーク,BONDを提案する。
具体的には,2段階の学習アルゴリズムを提案する。第1段階では,遠隔ラベルを用いて,事前学習された言語モデルをNERタスクに適用する。
第2段階では,遠隔ラベルを廃止し,モデル性能をさらに向上するための自己学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T04:55:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。