論文の概要: Semi-Supervised Disentangled Framework for Transferable Named Entity
Recognition
- arxiv url: http://arxiv.org/abs/2012.11805v1
- Date: Tue, 22 Dec 2020 02:55:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 07:45:56.405870
- Title: Semi-Supervised Disentangled Framework for Transferable Named Entity
Recognition
- Title(参考訳): トランスファーブルな名前付きエンティティ認識のための半スーパービジョン分散フレームワーク
- Authors: Zhifeng Hao, Di Lv, Zijian Li, Ruichu Cai, Wen Wen, Boyan Xu
- Abstract要約: 我々は、ドメイン不変の潜在変数とドメイン固有の潜在変数を区別する転送可能nerのための半教師付きフレームワークを提案する。
我々のモデルは、ドメイン間および言語間NERベンチマークデータセットを用いて最先端の性能を得ることができる。
- 参考スコア(独自算出の注目度): 27.472171967604602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) for identifying proper nouns in unstructured
text is one of the most important and fundamental tasks in natural language
processing. However, despite the widespread use of NER models, they still
require a large-scale labeled data set, which incurs a heavy burden due to
manual annotation. Domain adaptation is one of the most promising solutions to
this problem, where rich labeled data from the relevant source domain are
utilized to strengthen the generalizability of a model based on the target
domain. However, the mainstream cross-domain NER models are still affected by
the following two challenges (1) Extracting domain-invariant information such
as syntactic information for cross-domain transfer. (2) Integrating
domain-specific information such as semantic information into the model to
improve the performance of NER. In this study, we present a semi-supervised
framework for transferable NER, which disentangles the domain-invariant latent
variables and domain-specific latent variables. In the proposed framework, the
domain-specific information is integrated with the domain-specific latent
variables by using a domain predictor. The domain-specific and domain-invariant
latent variables are disentangled using three mutual information regularization
terms, i.e., maximizing the mutual information between the domain-specific
latent variables and the original embedding, maximizing the mutual information
between the domain-invariant latent variables and the original embedding, and
minimizing the mutual information between the domain-specific and
domain-invariant latent variables. Extensive experiments demonstrated that our
model can obtain state-of-the-art performance with cross-domain and
cross-lingual NER benchmark data sets.
- Abstract(参考訳): 非構造化テキスト中の固有名詞を識別するための名前付きエンティティ認識(NER)は、自然言語処理において最も重要かつ基本的なタスクの1つである。
しかし、NERモデルが広く使われているにもかかわらず、大規模なラベル付きデータセットが必要であるため、手動のアノテーションによって重い負担がかかる。
ドメイン適応は、対象ドメインに基づいたモデルの一般化性を高めるために、関連するソースドメインからのリッチなラベル付きデータを利用する、この問題に対する最も有望な解決策の1つである。
しかし、メインストリームのクロスドメインnerモデルは、(1)クロスドメイン転送のための構文情報などのドメイン不変情報を抽出するという2つの課題によってまだ影響を受ける。
2)NERの性能を向上させるため,意味情報などのドメイン固有情報をモデルに統合する。
本研究では、ドメイン不変な潜在変数とドメイン固有な潜在変数を区別するトランスファー可能なnerのための半教師付きフレームワークを提案する。
提案フレームワークでは、ドメイン固有情報とドメイン固有潜在変数をドメイン予測器を用いて統合する。
ドメイン固有およびドメイン不変潜在変数は、3つの相互情報正規化項、すなわちドメイン固有潜在変数と元の埋め込みとの間の相互情報を最大化し、ドメイン不変潜在変数と元の埋め込みとの間の相互情報を最大化し、ドメイン固有およびドメイン不変潜在変数間の相互情報を最小化する。
クロスドメインおよびクロスランガルなNERベンチマークデータセットを用いて、我々のモデルが最先端の性能を得ることができることを示した。
関連論文リスト
- Compound Domain Generalization via Meta-Knowledge Encoding [55.22920476224671]
マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文 参考訳(メタデータ) (2022-03-24T11:54:59Z) - TAL: Two-stream Adaptive Learning for Generalizable Person
Re-identification [115.31432027711202]
我々は、ドメイン固有性とドメイン不変性の両方が、re-idモデルの一般化能力の向上に不可欠であると主張する。
これら2種類の情報を同時にモデル化するために,2ストリーム適応学習 (TAL) を命名した。
我々のフレームワークは、単一ソースとマルチソースの両方のドメイン一般化タスクに適用できる。
論文 参考訳(メタデータ) (2021-11-29T01:27:42Z) - Exploiting Both Domain-specific and Invariant Knowledge via a Win-win
Transformer for Unsupervised Domain Adaptation [14.623272346517794]
Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的としている。
既存のUDAアプローチのほとんどは、ドメイン不変表現を学習し、2つのドメインにまたがる1つの分類器を共有することによって、知識伝達を可能にする。
我々はWin-Win TRansformerフレームワークを提案し、各ドメインのドメイン固有の知識を別々に探索し、ドメイン間の知識を交換する。
論文 参考訳(メタデータ) (2021-11-25T06:45:07Z) - Exploiting Domain-Specific Features to Enhance Domain Generalization [10.774902700296249]
ドメイン一般化(Domain Generalization, DG)は、観測されていないターゲットドメインで正常に動作するために、複数の観測されたソースドメインからモデルをトレーニングすることを目的としている。
以前のDGアプローチでは、ターゲットドメインを一般化するために、ソース間でのドメイン不変情報を抽出することに重点を置いていた。
本稿ではメタドメイン固有ドメイン不変量(mD)を提案する。
論文 参考訳(メタデータ) (2021-10-18T15:42:39Z) - Self-Adversarial Disentangling for Specific Domain Adaptation [52.1935168534351]
ドメイン適応は、ソースとターゲットドメイン間のドメインシフトをブリッジすることを目的としています。
最近の手法では、特定の次元について明示的な事前知識を考慮しないのが一般的である。
論文 参考訳(メタデータ) (2021-08-08T02:36:45Z) - Adaptive Domain-Specific Normalization for Generalizable Person
Re-Identification [81.30327016286009]
一般化可能なRe-IDのための適応型ドメイン固有正規化手法(AdsNorm)を提案する。
本研究では,一般化可能人物 Re-ID に対する適応領域特異的正規化手法 (AdsNorm) を提案する。
論文 参考訳(メタデータ) (2021-05-07T02:54:55Z) - Learning Disentangled Semantic Representation for Domain Adaptation [39.055191615410244]
本研究の目的は,データの意味表現におけるドメイン不変な意味情報を抽出することである。
上記の仮定の下では、意味的潜在変数とドメイン潜在変数を再構成するために変分オートエンコーダを用いる。
これら2組の再構成潜伏変数をアンタングル化する二重対向ネットワークを考案する。
論文 参考訳(メタデータ) (2020-12-22T03:03:36Z) - Domain Adaptation for Semantic Parsing [68.81787666086554]
本稿では,ドメイン適応のための新しいセマンティクスを提案する。このセマンティクスでは,ソースドメインと比較して,対象ドメインのアノテーション付きデータがはるかに少ない。
我々のセマンティックな利点は、2段階の粗大なフレームワークから得ており、2段階の異なる正確な処理を提供できる。
ベンチマークデータセットの実験により、我々の手法はいくつかの一般的なドメイン適応戦略より一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-06-23T14:47:41Z) - Bi-Directional Generation for Unsupervised Domain Adaptation [61.73001005378002]
教師なしのドメイン適応は、確立されたソースドメイン情報に依存するラベルなしのターゲットドメインを促進する。
従来の手法では、潜在空間におけるドメインの不一致を強制的に低減することで、本質的なデータ構造が破壊される。
本稿では、2つの中間領域をブリッジソースとターゲットドメインに補間する一貫した分類器を用いた双方向生成ドメイン適応モデルを提案する。
論文 参考訳(メタデータ) (2020-02-12T09:45:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。