論文の概要: SCL-RAI: Span-based Contrastive Learning with Retrieval Augmented
Inference for Unlabeled Entity Problem in NER
- arxiv url: http://arxiv.org/abs/2209.01646v3
- Date: Tue, 24 Oct 2023 15:07:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 03:40:05.235681
- Title: SCL-RAI: Span-based Contrastive Learning with Retrieval Augmented
Inference for Unlabeled Entity Problem in NER
- Title(参考訳): SCL-RAI:NERにおける未ラベルエンティティ問題に対する検索拡張推論を用いたスパン型コントラスト学習
- Authors: Shuzheng Si, Shuang Zeng, Jiaxing Lin, Baobao Chang
- Abstract要約: NERデータセットのラベルなしエンティティ問題は、NERのパフォーマンスを著しく損なう。
本稿では,この問題に対処するためのSCL-RAIを提案する。
提案手法は,2つの実世界のデータセットにおいて,従来のSOTA法を4.21%,F1スコア8.64%で大幅に上回っている。
- 参考スコア(独自算出の注目度): 30.231134189496952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named Entity Recognition is the task to locate and classify the entities in
the text. However, Unlabeled Entity Problem in NER datasets seriously hinders
the improvement of NER performance. This paper proposes SCL-RAI to cope with
this problem. Firstly, we decrease the distance of span representations with
the same label while increasing it for different ones via span-based
contrastive learning, which relieves the ambiguity among entities and improves
the robustness of the model over unlabeled entities. Then we propose retrieval
augmented inference to mitigate the decision boundary shifting problem. Our
method significantly outperforms the previous SOTA method by 4.21% and 8.64%
F1-score on two real-world datasets.
- Abstract(参考訳): 名前付きエンティティ認識は、テキスト内のエンティティを見つけて分類するタスクである。
しかし、NERデータセットのUnlabeled Entity Problemは、NERのパフォーマンスを著しく損なう。
本稿では,この問題に対処するためのSCL-RAIを提案する。
まず,異なるラベルで表現するスパンの距離を減らし,異なるラベルで表現するコントラスト学習を行うことにより,エンティティ間のあいまいさを軽減し,ラベルのないエンティティに対するモデルの堅牢性を向上させる。
そこで我々は,決定境界シフト問題を緩和する検索拡張推論を提案する。
本手法は,2つの実世界のデータセットにおいて,従来のSOTA法よりも4.21%,F1スコアが8.64%向上した。
関連論文リスト
- Beyond Boundaries: Learning a Universal Entity Taxonomy across Datasets and Languages for Open Named Entity Recognition [40.23783832224238]
我々は,Open NERの凝集性および効率的なデータセットであるB2NERDを提案する。
データセット間の一貫性のないエンティティ定義を検出し,識別可能なラベル名を用いて識別し,400以上のエンティティタイプを普遍的に分類する。
我々のB2NERモデルは、B2NERDでトレーニングされ、GPT-4を6.8-12.0 F1ポイント上回っており、15のデータセットと6つの言語にわたる3つのドメイン外のベンチマークで、以前のメソッドを上回っています。
論文 参考訳(メタデータ) (2024-06-17T03:57:35Z) - JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - Mutual Reinforcement Effects in Japanese Sentence Classification and
Named Entity Recognition Tasks [0.0]
文分類(SC)と名前付きエンティティ認識(NER)のためのSLGフレームワークを開発する。
フォーマット変換器を用いて、入力形式を統一し、生成モデルを用いてSCラベル、NERラベル、および関連するテキストセグメントを生成する。
その結果、SCの精度はSCNMで1.13ポイント、NERで1.06ポイント向上し、CMはフォーマットの精度を63.61から100に引き上げた。
論文 参考訳(メタデータ) (2023-07-18T14:30:36Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Adversarial Dual-Student with Differentiable Spatial Warping for
Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。
また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。
我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文 参考訳(メタデータ) (2022-03-05T17:36:17Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition [9.809157050048375]
名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
論文 参考訳(メタデータ) (2021-05-14T12:52:34Z) - Improving Face Recognition by Clustering Unlabeled Faces in the Wild [77.48677160252198]
極値理論に基づく新しいアイデンティティ分離法を提案する。
重なり合うラベルノイズによる問題を大幅に低減する。
制御された設定と実際の設定の両方の実験は、我々のメソッドの一貫性のある改善を示している。
論文 参考訳(メタデータ) (2020-07-14T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。