論文の概要: Integrating Boundary Assembling into a DNN Framework for Named Entity
Recognition in Chinese Social Media Text
- arxiv url: http://arxiv.org/abs/2002.11910v1
- Date: Thu, 27 Feb 2020 04:29:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 08:41:56.960219
- Title: Integrating Boundary Assembling into a DNN Framework for Named Entity
Recognition in Chinese Social Media Text
- Title(参考訳): 中国のソーシャルメディアテキストにおける名前付きエンティティ認識のためのDNNフレームワークへの境界組立の統合
- Authors: Zhaoheng Gong, Ping Chen, Jiang Zhou
- Abstract要約: 中国語の単語境界もまたエンティティ境界であるため、中国語のテキストに対する名前付きエンティティ認識は単語境界検出の恩恵を受けることができる。
本稿では,最先端の深層ニューラルネットワークモデルと境界組立手法を統合し,その更新された単語境界情報を名前付きエンティティ認識のための条件付きランダムフィールドモデルに組み込む。
本手法は,従来の最先端結果よりも2%の絶対的な改善を示した。
- 参考スコア(独自算出の注目度): 3.7239227834407735
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition is a challenging task in Natural Language
Processing, especially for informal and noisy social media text. Chinese word
boundaries are also entity boundaries, therefore, named entity recognition for
Chinese text can benefit from word boundary detection, outputted by Chinese
word segmentation. Yet Chinese word segmentation poses its own difficulty
because it is influenced by several factors, e.g., segmentation criteria,
employed algorithm, etc. Dealt improperly, it may generate a cascading failure
to the quality of named entity recognition followed. In this paper we integrate
a boundary assembling method with the state-of-the-art deep neural network
model, and incorporate the updated word boundary information into a conditional
random field model for named entity recognition. Our method shows a 2% absolute
improvement over previous state-of-the-art results.
- Abstract(参考訳): 名前付きエンティティ認識は自然言語処理において特に非公式で騒がしいソーシャルメディアテキストにとって難しい課題である。
中国語の単語境界もまたエンティティ境界であるため、中国語の単語分割によって出力される単語境界検出の恩恵を受けることができる。
しかし、中国語のセグメンテーションは、セグメンテーション基準や採用アルゴリズムなど、いくつかの要因の影響を受けているため、独自の難題を呈している。
不適切に、名前付きエンティティ認識の品質にカスケード障害が発生する可能性がある。
本稿では,最先端の深層ニューラルネットワークモデルと境界組立手法を統合し,更新された単語境界情報を名前付きエンティティ認識のための条件付きランダムフィールドモデルに組み込む。
本手法は,従来の結果よりも絶対値が2%向上することを示す。
関連論文リスト
- Semantic Connectivity-Driven Pseudo-labeling for Cross-domain
Segmentation [89.41179071022121]
自己学習はドメイン間セマンティックセグメンテーションにおいて一般的なアプローチである。
本稿ではセマンティック・コネクティビティ駆動の擬似ラベル方式を提案する。
このアプローチは、接続レベルにおいて擬似ラベルを定式化し、構造的および低雑音のセマンティクスの学習を容易にする。
論文 参考訳(メタデータ) (2023-12-11T12:29:51Z) - Incorporating Class-based Language Model for Named Entity Recognition in Factorized Neural Transducer [50.572974726351504]
クラスベースのLMをFNTに組み込んだ新しいE2EモデルであるC-FNTを提案する。
C-FNTでは、名前付きエンティティのLMスコアは、その表面形式の代わりに名前クラスに関連付けることができる。
実験の結果,提案したC-FNTは,単語認識の性能を損なうことなく,名前付きエンティティの誤りを著しく低減することがわかった。
論文 参考訳(メタデータ) (2023-09-14T12:14:49Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Associating Spatially-Consistent Grouping with Text-supervised Semantic
Segmentation [117.36746226803993]
テキスト教師付きセマンティックセグメンテーションを用いた自己教師付き空間一貫性グループ化を提案する。
部分的なグループ化結果を考えると、さらに画像レベルから領域レベルへのテキスト教師付きモデルを適用する。
59.2% mIoU と 32.4% mIoU を Pascal VOC および Pascal Context ベンチマークで達成した。
論文 参考訳(メタデータ) (2023-04-03T16:24:39Z) - ConNER: Consistency Training for Cross-lingual Named Entity Recognition [96.84391089120847]
言語間の名前付きエンティティ認識は、対象言語のデータの不足に悩まされる。
言語間NERのための新しい一貫性トレーニングフレームワークとしてConNERを提案する。
論文 参考訳(メタデータ) (2022-11-17T07:57:54Z) - Improving Chinese Named Entity Recognition by Search Engine Augmentation [2.971423962840551]
そこで我々は,中国語NERのサーチエンジンから外部知識を用いて意味拡張を行うニューラルネットワークアプローチを提案する。
特に、検索エンジンから検索した外部関連テキストを集約する拡張入力表現を生成するために、多チャンネル意味融合モデルを採用する。
論文 参考訳(メタデータ) (2022-10-23T08:42:05Z) - ANEC: An Amharic Named Entity Corpus and Transformer Based Recognizer [0.0]
本稿では,条件付きランダムフィールド層を用いた双方向長短期記憶に基づくAmharicというエンティティ認識システムを提案する。
我々の名前付きエンティティ認識システムは93%のF_1スコアを達成しており、これはAmharicの名前付きエンティティ認識の新しい最先端結果である。
論文 参考訳(メタデータ) (2022-07-02T09:50:37Z) - DAMO-NLP at SemEval-2022 Task 11: A Knowledge-based System for
Multilingual Named Entity Recognition [94.1865071914727]
MultiCoNERは、複数の言語に対する短文と低文設定で意味的に曖昧な名前のエンティティを検出することを目的としている。
我々のチームDAMO-NLPは知識に基づくシステムを提案し、ウィキペディアに基づく多言語知識ベースを構築する。
入力文が与えられた場合,本システムは知識ベースから関連コンテキストを効果的に検索する。
我々のシステムはMultiCoNER共有タスクで13トラック中10トラックを獲得した。
論文 参考訳(メタデータ) (2022-03-01T15:29:35Z) - Joint Chinese Word Segmentation and Part-of-speech Tagging via Two-stage
Span Labeling [0.2624902795082451]
SpanSegTagと名づけられた中国語単語分割と音声タグ付けのためのニューラルモデルを提案する。
実験の結果,BERTベースのモデルであるSpanSegTagは,CTB5,CTB6,UDデータセット上での競合性能を達成した。
論文 参考訳(メタデータ) (2021-12-17T12:59:02Z) - Enhancing Sindhi Word Segmentation using Subword Representation Learning and Position-aware Self-attention [19.520840812910357]
シンディー語のセグメンテーションは、宇宙の欠落と挿入の問題のために難しい課題である。
既存のシンディー語のセグメンテーション手法は手作りの機能の設計と組み合わせに依存している。
本稿では,単語分割をシーケンスラベリングタスクとして扱うサブワードガイド型ニューラルワードセグメンタ(SGNWS)を提案する。
論文 参考訳(メタデータ) (2020-12-30T08:31:31Z) - Incorporating Uncertain Segmentation Information into Chinese NER for
Social Media Text [18.455836845989523]
セグメンテーションエラーの伝播は、中国のエンティティ認識システムにとっての課題である。
中国のソーシャルメディアテキストからエンティティを識別するモデル(UIcwsNN)を提案する。
論文 参考訳(メタデータ) (2020-04-14T09:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。