論文の概要: Delving Deep into Regularity: A Simple but Effective Method for Chinese
Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2204.05544v1
- Date: Tue, 12 Apr 2022 06:12:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 12:48:40.513178
- Title: Delving Deep into Regularity: A Simple but Effective Method for Chinese
Named Entity Recognition
- Title(参考訳): 正則性に深く潜入する:中国の固有実体認識のための単純だが効果的な方法
- Authors: Yingjie Gu, Xiaoye Qu, Zhefeng Wang, Yi Zheng, Baoxing Huai, Nicholas
Jing Yuan
- Abstract要約: 中国語NERにおけるエンティティスパンの規則性を調べるための,単純かつ効果的な手法を提案する。
提案モデルは,正則性認識モジュールと正則性認識モジュールの2つの分岐からなる。
我々のRICONは、様々なレキシコン法を含む従来の最先端手法よりも大幅に優れています。
- 参考スコア(独自算出の注目度): 25.219737990970682
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have witnessed the improving performance of Chinese Named Entity
Recognition (NER) from proposing new frameworks or incorporating word lexicons.
However, the inner composition of entity mentions in character-level Chinese
NER has been rarely studied. Actually, most mentions of regular types have
strong name regularity. For example, entities end with indicator words such as
"company" or "bank" usually belong to organization. In this paper, we propose a
simple but effective method for investigating the regularity of entity spans in
Chinese NER, dubbed as Regularity-Inspired reCOgnition Network (RICON).
Specifically, the proposed model consists of two branches: a regularity-aware
module and a regularityagnostic module. The regularity-aware module captures
the internal regularity of each span for better entity type prediction, while
the regularity-agnostic module is employed to locate the boundary of entities
and relieve the excessive attention to span regularity. An orthogonality space
is further constructed to encourage two modules to extract different aspects of
regularity features. To verify the effectiveness of our method, we conduct
extensive experiments on three benchmark datasets and a practical medical
dataset. The experimental results show that our RICON significantly outperforms
previous state-of-the-art methods, including various lexicon-based methods.
- Abstract(参考訳): 近年,中国における名前付きエンティティ認識(NER)の性能向上は,新たなフレームワークの提案や単語レキシコンの導入によるものだ。
しかし、文字レベルの中国語のnerでは、エンティティを参照する内部構成が研究されることはほとんどない。
実際、正則型のほとんどの言及は強い名前規則性を持っている。
例えば、エンティティは通常、組織に属する"company"や"bank"といった指標語で終わる。
本稿では,中国NERにおけるエンティティスパンの規則性について,RICON(Regularity-Inspired Recognition Network)と呼ばれる簡易かつ効果的な調査手法を提案する。
具体的には,正則性認識モジュールと正則性認識モジュールの2つの分岐からなる。
正規性認識モジュールは、エンティティタイプ予測を改善するために各スパンの内部正規性をキャプチャし、正規性非依存モジュールは、エンティティの境界の位置を特定し、スパン正規性に対する過度な注意を緩和するために使用される。
直交空間はさらに、2つの加群が正則性の特徴の異なる側面を抽出することを奨励するために構成される。
本手法の有効性を検証するため、3つのベンチマークデータセットと実用的な医療データセットについて広範な実験を行った。
実験の結果, RICONは様々なレキシコン法を含む従来の最先端手法よりも優れていた。
関連論文リスト
- A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Nested Named Entity Recognition as Holistic Structure Parsing [92.8397338250383]
本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2022-04-17T12:48:20Z) - Nested Named Entity Recognition as Latent Lexicalized Constituency
Parsing [29.705133932275892]
最近(Fu et al, 2021)は、ネストされたNERに取り組むために、スパンベースの選挙区に適応している。
本研究では, より表現力のある構造, 語彙化された選挙区木を用いて, 成分がキーワードでアノテートされる。
我々はアイズナー・サッタのアルゴリズムを有効活用し,部分的辺縁化と推論を効率的に行う。
論文 参考訳(メタデータ) (2022-03-09T12:02:59Z) - DaN+: Danish Nested Named Entities and Lexical Normalization [18.755176247223616]
本稿では,デンマークのネスト付き名前付きエンティティ(NE)と語彙正規化のための,新しいマルチドメインコーパスとアノテーションガイドラインであるDaN+を紹介する。
我々は,NERタスクをモデル化する3つの戦略を実証的に評価した。
以上の結果から,1)多ラベル復号化と競合するマルチタスク学習,2) BERTベースのNERモデルはドメインシフトに敏感であり,3) 言語内BERTと語彙正規化は最小標準データにおいて最も有用であることが示唆された。
論文 参考訳(メタデータ) (2021-05-24T14:35:21Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition [9.809157050048375]
名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
論文 参考訳(メタデータ) (2021-05-14T12:52:34Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。