論文の概要: Improving Chinese Named Entity Recognition by Search Engine Augmentation
- arxiv url: http://arxiv.org/abs/2210.12662v1
- Date: Sun, 23 Oct 2022 08:42:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 13:37:20.288724
- Title: Improving Chinese Named Entity Recognition by Search Engine Augmentation
- Title(参考訳): 検索エンジン拡張による中国語名前付きエンティティ認識の改善
- Authors: Qinghua Mao and Jiatong Li and Kui Meng
- Abstract要約: そこで我々は,中国語NERのサーチエンジンから外部知識を用いて意味拡張を行うニューラルネットワークアプローチを提案する。
特に、検索エンジンから検索した外部関連テキストを集約する拡張入力表現を生成するために、多チャンネル意味融合モデルを採用する。
- 参考スコア(独自算出の注目度): 2.971423962840551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compared with English, Chinese suffers from more grammatical ambiguities,
like fuzzy word boundaries and polysemous words. In this case, contextual
information is not sufficient to support Chinese named entity recognition
(NER), especially for rare and emerging named entities. Semantic augmentation
using external knowledge is a potential way to alleviate this problem, while
how to obtain and leverage external knowledge for the NER task remains a
challenge. In this paper, we propose a neural-based approach to perform
semantic augmentation using external knowledge from search engine for Chinese
NER. In particular, a multi-channel semantic fusion model is adopted to
generate the augmented input representations, which aggregates external related
texts retrieved from the search engine. Experiments have shown the superiority
of our model across 4 NER datasets, including formal and social media language
contexts, which further prove the effectiveness of our approach.
- Abstract(参考訳): 英語と比較すると、中国語はファジィ語の境界や多義語など、文法的な曖昧さに苦しむ。
この場合、文脈情報は、特に稀で新しい名前付きエンティティにおいて、中国の名前付きエンティティ認識(NER)をサポートするには不十分である。
外部知識を用いた意味的拡張はこの問題を緩和する潜在的方法であり、NERタスクに対する外部知識の獲得と活用は依然として課題である。
本稿では,中国語NERのサーチエンジンから外部知識を用いて意味拡張を行うニューラルネットワークアプローチを提案する。
特に、検索エンジンから検索された外部関連テキストを集約する拡張入力表現を生成するために、マルチチャネル意味融合モデルが採用されている。
実験により,フォーマルおよびソーシャルメディア言語コンテキストを含む4つのnerデータセットにわたるモデルの優越性が示され,このアプローチの有効性がさらに証明された。
関連論文リスト
- DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Dynamic Multi-View Fusion Mechanism For Chinese Relation Extraction [12.818297160055584]
そこで我々は,中国関係抽出のための多視点特徴を動的に学習するMix-of-view-experts framework(MoVE)を提案する。
漢字の内的知識と外的知識の両面から,我々の枠組みは漢字の意味情報をよりよく捉えることができる。
論文 参考訳(メタデータ) (2023-03-09T07:35:31Z) - DAMO-NLP at SemEval-2022 Task 11: A Knowledge-based System for
Multilingual Named Entity Recognition [94.1865071914727]
MultiCoNERは、複数の言語に対する短文と低文設定で意味的に曖昧な名前のエンティティを検出することを目的としている。
我々のチームDAMO-NLPは知識に基づくシステムを提案し、ウィキペディアに基づく多言語知識ベースを構築する。
入力文が与えられた場合,本システムは知識ベースから関連コンテキストを効果的に検索する。
我々のシステムはMultiCoNER共有タスクで13トラック中10トラックを獲得した。
論文 参考訳(メタデータ) (2022-03-01T15:29:35Z) - TURNER: The Uncertainty-based Retrieval Framework for Chinese NER [46.063487367225754]
我々は、中国語NERのための不確実性に基づく検索フレームワークTURNERを提案する。
TURNERの背景にある考え方は、人間の行動を模倣することである。
4つのベンチマークデータセットの実験では、TURNERの有効性が示されている。
論文 参考訳(メタデータ) (2022-02-18T05:05:22Z) - Knowledge Graph Augmented Network Towards Multiview Representation
Learning for Aspect-based Sentiment Analysis [96.53859361560505]
本稿では,知識グラフ拡張ネットワーク(KGAN)を提案する。
KGANは感情の特徴表現を、文脈、構文、知識に基づく複数の視点から捉えている。
3つの人気のあるABSAベンチマークの実験は、我々のKGANの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-01-13T08:25:53Z) - Empirical Study of Named Entity Recognition Performance Using
Distribution-aware Word Embedding [15.955385058787348]
そこで我々は,NERフレームワークにおける分散情報を利用するために,分散対応単語埋め込みを開発し,三つの異なる手法を実装した。
単語特異性が既存のNERメソッドに組み込まれれば、NERのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-09-03T17:28:04Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - Exhaustive Entity Recognition for Coptic: Challenges and Solutions [8.980876474818153]
本稿では,エジプトのヘレニズム時代の言語であるコプトの実体認識について述べる。
タスクに対するNLPアプローチを評価し、低リソースで形態学的に複雑な言語に適用することの難しさを概観する。
我々は,ウィキペディアにリンクするネスト付きエンティリティ認識と半自動エンティティを,頑健な依存関係解析,機能ベースのCRFモデル,手作りの知識ベースリソースに頼って,名前付きおよび名前なしのネスト付きエンティリティ認識と半自動エンティティのソリューションを提案する。
論文 参考訳(メタデータ) (2020-11-03T23:49:42Z) - Integrating Boundary Assembling into a DNN Framework for Named Entity
Recognition in Chinese Social Media Text [3.7239227834407735]
中国語の単語境界もまたエンティティ境界であるため、中国語のテキストに対する名前付きエンティティ認識は単語境界検出の恩恵を受けることができる。
本稿では,最先端の深層ニューラルネットワークモデルと境界組立手法を統合し,その更新された単語境界情報を名前付きエンティティ認識のための条件付きランダムフィールドモデルに組み込む。
本手法は,従来の最先端結果よりも2%の絶対的な改善を示した。
論文 参考訳(メタデータ) (2020-02-27T04:29:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。