論文の概要: DualNER: A Dual-Teaching framework for Zero-shot Cross-lingual Named
Entity Recognition
- arxiv url: http://arxiv.org/abs/2211.08104v1
- Date: Tue, 15 Nov 2022 12:50:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 14:36:36.119805
- Title: DualNER: A Dual-Teaching framework for Zero-shot Cross-lingual Named
Entity Recognition
- Title(参考訳): DualNER: ゼロショット言語間の名前付きエンティティ認識のためのデュアルティーチングフレームワーク
- Authors: Jiali Zeng, Yufan Jiang, Yongjing Yin, Xu Wang, Binghuai Lin, Yunbo
Cao
- Abstract要約: DualNERは、注釈付きソース言語コーパスとラベルなしターゲット言語テキストの両方をフル活用するためのフレームワークである。
NERの2つの相補的な学習パラダイム、すなわちシーケンスラベリングとスパン予測を統合マルチタスクフレームワークに統合する。
- 参考スコア(独自算出の注目度): 27.245171237640502
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present DualNER, a simple and effective framework to make full use of both
annotated source language corpus and unlabeled target language text for
zero-shot cross-lingual named entity recognition (NER). In particular, we
combine two complementary learning paradigms of NER, i.e., sequence labeling
and span prediction, into a unified multi-task framework. After obtaining a
sufficient NER model trained on the source data, we further train it on the
target data in a {\it dual-teaching} manner, in which the pseudo-labels for one
task are constructed from the prediction of the other task. Moreover, based on
the span prediction, an entity-aware regularization is proposed to enhance the
intrinsic cross-lingual alignment between the same entities in different
languages. Experiments and analysis demonstrate the effectiveness of our
DualNER. Code is available at https://github.com/lemon0830/dualNER.
- Abstract(参考訳): 本稿では,ゼロショットクロスリンガル・エンティティ認識(ner)のための注釈付きソース言語コーパスとラベルなしターゲット言語テキストの両方をフル活用するための,単純かつ効果的なフレームワークであるdualnerを提案する。
特に,nerの2つの相補的な学習パラダイム,すなわちシーケンスラベリングとスパン予測を統合マルチタスクフレームワークに統合した。
ソースデータに基づいて訓練された十分なNERモデルを得た後、他のタスクの予測から1つのタスクの擬似ラベルが構築されるように、ターゲットデータに対してさらに訓練を行う。
さらに、スパン予測に基づいて、異なる言語における同一エンティティ間の固有の言語間アライメントを強化するために、エンティティ認識の正規化を提案する。
実験と分析によりDualNERの有効性が示された。
コードはhttps://github.com/lemon0830/dualNERで入手できる。
関連論文リスト
- In-Context Learning for Few-Shot Nested Named Entity Recognition [53.55310639969833]
数発のネストネストNERの設定に有効で革新的なICLフレームワークを導入する。
我々は、新しい実演選択機構であるEnDe retrieverを考案し、ICLプロンプトを改善する。
EnDe検索では,意味的類似性,境界類似性,ラベル類似性という3種類の表現学習を行うために,コントラスト学習を用いる。
論文 参考訳(メタデータ) (2024-02-02T06:57:53Z) - mCL-NER: Cross-Lingual Named Entity Recognition via Multi-view
Contrastive Learning [54.523172171533645]
CrossNERは多言語コーパスの不足により不均一な性能から生じる課題に直面している。
言語横断的名前付きエンティティ認識(mCL-NER)のためのマルチビューコントラスト学習を提案する。
40言語にまたがるXTREMEベンチマーク実験では、従来のデータ駆動型およびモデルベースアプローチよりもmCL-NERの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-08-17T16:02:29Z) - Improving Self-training for Cross-lingual Named Entity Recognition with
Contrastive and Prototype Learning [80.08139343603956]
言語横断的な実体認識において、自己学習は言語的ギャップを埋めるために一般的に用いられる。
本研究では,表現学習と擬似ラベル改善を組み合わせることで,言語間NERの自己学習を改善することを目的とする。
提案手法,すなわちContProtoは主に,(1)コントラスト型自己学習と(2)プロトタイプベース擬似ラベルの2つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-05-23T02:52:16Z) - VECO 2.0: Cross-lingual Language Model Pre-training with
Multi-granularity Contrastive Learning [56.47303426167584]
複数粒度アライメントを持つコントラスト学習に基づく言語間事前学習モデルVECO2.0を提案する。
具体的には、シーケンス・ツー・シーケンスアライメントが誘導され、並列対の類似性を最大化し、非並列対を最小化する。
トークン・ツー・トークンのアライメントは、シソーラス辞書を介して発掘された同義トークンと、バイリンガルな例の他の未使用トークンとのギャップを埋めるために統合される。
論文 参考訳(メタデータ) (2023-04-17T12:23:41Z) - ConNER: Consistency Training for Cross-lingual Named Entity Recognition [96.84391089120847]
言語間の名前付きエンティティ認識は、対象言語のデータの不足に悩まされる。
言語間NERのための新しい一貫性トレーニングフレームワークとしてConNERを提案する。
論文 参考訳(メタデータ) (2022-11-17T07:57:54Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - A Dual-Contrastive Framework for Low-Resource Cross-Lingual Named Entity
Recognition [5.030581940990434]
クロスランガルな名前付きエンティティ認識(NER)は、低リソース言語におけるデータ空白問題を緩和できるため、最近研究ホットスポットになっている。
本稿では,言語間NERのための2言語コントラストフレームワーク ConCNER について述べる。
論文 参考訳(メタデータ) (2022-04-02T07:59:13Z) - Single-/Multi-Source Cross-Lingual NER via Teacher-Student Learning on
Unlabeled Data in Target Language [28.8970132244542]
言語間NERは、リッチなラベル付きデータを持つソース言語から学んだ知識を活用する必要がある。
このような制約に対処する教師支援学習手法を提案する。
提案手法は,シングルソースとマルチソースのクロスランガルNERにおいて,既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-04-26T17:22:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。