論文の概要: TURNER: The Uncertainty-based Retrieval Framework for Chinese NER
- arxiv url: http://arxiv.org/abs/2202.09022v1
- Date: Fri, 18 Feb 2022 05:05:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-21 13:03:02.582341
- Title: TURNER: The Uncertainty-based Retrieval Framework for Chinese NER
- Title(参考訳): TURNER:中国のNERのための不確実性ベースの検索フレームワーク
- Authors: Zhichao Geng, Hang Yan, Zhangyue Yin, Chenxin An, Xipeng Qiu
- Abstract要約: 我々は、中国語NERのための不確実性に基づく検索フレームワークTURNERを提案する。
TURNERの背景にある考え方は、人間の行動を模倣することである。
4つのベンチマークデータセットの実験では、TURNERの有効性が示されている。
- 参考スコア(独自算出の注目度): 46.063487367225754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese NER is a difficult undertaking due to the ambiguity of Chinese
characters and the absence of word boundaries. Previous work on Chinese NER
focus on lexicon-based methods to introduce boundary information and reduce
out-of-vocabulary (OOV) cases during prediction. However, it is expensive to
obtain and dynamically maintain high-quality lexicons in specific domains,
which motivates us to utilize more general knowledge resources, e.g., search
engines. In this paper, we propose TURNER: The Uncertainty-based Retrieval
framework for Chinese NER. The idea behind TURNER is to imitate human behavior:
we frequently retrieve auxiliary knowledge as assistance when encountering an
unknown or uncertain entity. To improve the efficiency and effectiveness of
retrieval, we first propose two types of uncertainty sampling methods for
selecting the most ambiguous entity-level uncertain components of the input
text. Then, the Knowledge Fusion Model re-predict the uncertain samples by
combining retrieved knowledge. Experiments on four benchmark datasets
demonstrate TURNER's effectiveness. TURNER outperforms existing lexicon-based
approaches and achieves the new SOTA.
- Abstract(参考訳): 中国語のNERは、漢字の曖昧さと単語境界の欠如のために難しい作業である。
これまでの中国NERの研究は、境界情報を導入し、予測中のOV(out-of-vocabulary)ケースを減らすための辞書ベースの手法に重点を置いていた。
しかし、特定のドメインで高品質なレキシコンを取得し、動的に維持することは高価であり、検索エンジンのようなより一般的な知識資源を利用する動機となる。
本稿では,中国語NERのための不確実性に基づく検索フレームワークTURNERを提案する。
我々はしばしば、未知または未知の実体に遭遇するときに補助的な知識を補助として取り出す。
検索の効率性と有効性を改善するために,入力テキストの最も曖昧なエンティティレベルの不確実なコンポーネントを選択するための2種類の不確実性サンプリング手法を提案する。
そして、知識融合モデルにより、得られた知識を組み合わせて不確実なサンプルを再予測する。
4つのベンチマークデータセットの実験では、TURNERの有効性が示されている。
TURNERは既存のレキシコンベースのアプローチより優れ、新しいSOTAを実現する。
関連論文リスト
- FecTek: Enhancing Term Weight in Lexicon-Based Retrieval with Feature Context and Term-level Knowledge [54.61068946420894]
FEature Context と TErm レベルの知識モジュールを導入して,革新的な手法を提案する。
項重みの特徴コンテキスト表現を効果的に強化するために、FCM(Feature Context Module)が導入された。
また,用語レベルの知識を効果的に活用し,用語重みのモデル化プロセスをインテリジェントに導くための用語レベルの知識誘導モジュール(TKGM)を開発した。
論文 参考訳(メタデータ) (2024-04-18T12:58:36Z) - SCANNER: Knowledge-Enhanced Approach for Robust Multi-modal Named Entity Recognition of Unseen Entities [10.193908215351497]
3つのNER変種を効果的に扱えるモデルであるSCANNERを提案する。
SCANNERは2段階構造であり、最初の段階でエンティティ候補を抽出し、知識を得るためにクエリとして使用する。
NERデータセットのノイズの多いアノテーションから生じる課題に対処するために,新しい自己蒸留法を提案する。
論文 参考訳(メタデータ) (2024-04-02T13:05:41Z) - On Significance of Subword tokenization for Low Resource and Efficient
Named Entity Recognition: A case study in Marathi [1.6383036433216434]
低リソース言語のためのNERに焦点をあて、インド語Marathiの文脈におけるケーススタディを示す。
BERTベースのサブワードトークン化器をバニラCNN/LSTMモデルに統合することで,効率的なNERのためのハイブリッド手法を提案する。
従来の単語ベースのトークン化器をBERTトークン化器に置き換えるという単純なアプローチは,バニラ単層モデルの精度をBERTのような深層事前学習モデルの精度に近づけることを示す。
論文 参考訳(メタデータ) (2023-12-03T06:53:53Z) - Empirical Study of Zero-Shot NER with ChatGPT [19.534329209433626]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて強力な能力を示した。
本研究はゼロショット情報抽出におけるLLM性能の探索に焦点をあてる。
記号的推論と算術的推論におけるLLMの顕著な推論能力に着想を得て, 代表的な推論手法をNERに適用する。
論文 参考訳(メタデータ) (2023-10-16T03:40:03Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Competency-Aware Neural Machine Translation: Can Machine Translation
Know its Own Translation Quality? [61.866103154161884]
ニューラルマシン翻訳(NMT)は、意識せずに起こる失敗に対してしばしば批判される。
本稿では,従来のNMTを自己推定器で拡張することで,新たな能力認識型NMTを提案する。
提案手法は品質評価において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-11-25T02:39:41Z) - Improving Chinese Named Entity Recognition by Search Engine Augmentation [2.971423962840551]
そこで我々は,中国語NERのサーチエンジンから外部知識を用いて意味拡張を行うニューラルネットワークアプローチを提案する。
特に、検索エンジンから検索した外部関連テキストを集約する拡張入力表現を生成するために、多チャンネル意味融合モデルを採用する。
論文 参考訳(メタデータ) (2022-10-23T08:42:05Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - Building Low-Resource NER Models Using Non-Speaker Annotation [58.78968578460793]
言語横断的な手法はこれらの懸念に対処する上で顕著な成功を収めた。
本稿では,Non-Speaker''(NS)アノテーションを用いた低リソース名前付きエンティティ認識(NER)モデル構築のための補完的アプローチを提案する。
NSアノテータの使用は、現代の文脈表現上に構築された言語間メソッドよりも、一貫した結果が得られることを示す。
論文 参考訳(メタデータ) (2020-06-17T03:24:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。