論文の概要: Few-shot Named Entity Recognition via Superposition Concept Discrimination
- arxiv url: http://arxiv.org/abs/2403.16463v1
- Date: Mon, 25 Mar 2024 06:45:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 15:47:46.352580
- Title: Few-shot Named Entity Recognition via Superposition Concept Discrimination
- Title(参考訳): 重ね合わせ概念識別による名前付きエンティティ認識
- Authors: Jiawei Chen, Hongyu Lin, Xianpei Han, Yaojie Lu, Shanshan Jiang, Bin Dong, Le Sun,
- Abstract要約: Few-shot NERは、限られた数のイラストレーターインスタンスでターゲット型のエンティティを識別することを目的としている。
本稿では,上述の課題を能動的学習パラダイムを用いて解決する重ね合わせ概念判別器(SuperCD)を提案する。
実験の結果、SuperCDはイラストレーターインスタンスから重ね合わせの概念を効果的に識別し、大規模コーパスから重ね合わせインスタンスを検索し、最小限の追加努力で数発のNER性能を大幅に改善できることがわかった。
- 参考スコア(独自算出の注目度): 47.90487572585672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot NER aims to identify entities of target types with only limited number of illustrative instances. Unfortunately, few-shot NER is severely challenged by the intrinsic precise generalization problem, i.e., it is hard to accurately determine the desired target type due to the ambiguity stemming from information deficiency. In this paper, we propose Superposition Concept Discriminator (SuperCD), which resolves the above challenge via an active learning paradigm. Specifically, a concept extractor is first introduced to identify superposition concepts from illustrative instances, with each concept corresponding to a possible generalization boundary. Then a superposition instance retriever is applied to retrieve corresponding instances of these superposition concepts from large-scale text corpus. Finally, annotators are asked to annotate the retrieved instances and these annotated instances together with original illustrative instances are used to learn FS-NER models. To this end, we learn a universal concept extractor and superposition instance retriever using a large-scale openly available knowledge bases. Experiments show that SuperCD can effectively identify superposition concepts from illustrative instances, retrieve superposition instances from large-scale corpus, and significantly improve the few-shot NER performance with minimal additional efforts.
- Abstract(参考訳): Few-shot NERは、限られた数のイラストレーターインスタンスでターゲット型のエンティティを識別することを目的としている。
残念なことに、少数ショットのNERは、固有の正確な一般化問題、すなわち情報不足に起因するあいまいさによる所望のターゲットタイプを正確に決定することは困難である。
本稿では,この課題をアクティブな学習パラダイムを用いて解決するスーパーポジション概念判別器(SuperCD)を提案する。
具体的には、概念抽出器が最初に導入され、図形のインスタンスから重ね合わせの概念を識別し、各概念は一般化境界に対応する。
次に、重畳インスタンス検索器を適用して、これらの重畳概念の対応するインスタンスを大規模テキストコーパスから検索する。
最後に、アノテータは検索したインスタンスにアノテートするよう求められ、これらのアノテートされたインスタンスと元のイラストレーターインスタンスはFS-NERモデルを学習するために使用される。
そこで我々は,大規模に公開されている知識ベースを用いて,普遍的な概念抽出と重ね合わせのインスタンス検索を学習する。
実験の結果、SuperCDはイラストレーターインスタンスから重ね合わせの概念を効果的に識別し、大規模コーパスから重ね合わせインスタンスを検索し、最小限の追加努力で数発のNER性能を大幅に改善できることがわかった。
関連論文リスト
- Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - A Unified Label-Aware Contrastive Learning Framework for Few-Shot Named Entity Recognition [6.468625143772815]
ラベル認識型トークンレベルのコントラスト学習フレームワークを提案する。
提案手法は,ラベルのセマンティクスを接尾辞のプロンプトとして活用することでコンテキストを豊かにする。
コンテキストネイティブとコンテキストラベルの対比学習目標を同時に最適化する。
論文 参考訳(メタデータ) (2024-04-26T06:19:21Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Perceive, Excavate and Purify: A Novel Object Mining Framework for
Instance Segmentation [4.375012768093524]
本稿では,新しいオブジェクトマイニングフレームワークを提案する。
まず、サブネットを知覚するセマンティクスを導入し、ボトムアップから明らかなインスタンスに属するピクセルをキャプチャする。
このメカニズムでは、事前認識されたセマンティクスは分類と位置を持つ元のインスタンスと見なされ、これらの元のインスタンスを取り巻く識別不能なオブジェクトはマイニングされる。
論文 参考訳(メタデータ) (2023-04-18T08:47:03Z) - Learning Permutation-Invariant Embeddings for Description Logic Concepts [1.1650381752104297]
概念学習は、背景知識と入力例から記述論理の概念を学ぶことを扱う。
この非自明なタスクは、無限の準順序空間内の探索問題として定式化されることが多い。
学習問題を多ラベル分類問題として再構成し、置換不変な埋め込みを学習するニューラル埋め込みモデル(NERO)を提案する。
論文 参考訳(メタデータ) (2023-03-03T10:57:04Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - Train a One-Million-Way Instance Classifier for Unsupervised Visual
Representation Learning [45.510042484456854]
本稿では、パラメトリックなインスタンスレベルの計算を用いて、データセット内のすべての画像を識別するプリテキストタスクを備えた、単純な教師なし視覚表現学習法を提案する。
全体的なフレームワークは教師付き分類モデルのレプリカであり、セマンティッククラス(犬、鳥、船など)はインスタンスIDに置き換えられる。
数千のセマンティックラベルから数百万のインスタンスラベルへの分類タスクのスケールアップは、1)大規模ソフトマックス分類器、2)インスタンスサンプルの頻度の低い訪問による緩やかな収束、3)ノイズの多い大量の負のクラスなど、特定の課題をもたらす。
論文 参考訳(メタデータ) (2021-02-09T14:44:18Z) - Object Instance Mining for Weakly Supervised Object Detection [24.021995037282394]
本稿では,オブジェクト検出の弱いエンドツーエンドのオブジェクトインスタンスマイニング(OIM)フレームワークを提案する。
OIMは、空間グラフと外観グラフに情報伝搬を導入することにより、各画像に存在する全ての可能なオブジェクトインスタンスを検知しようとする。
反復学習プロセスでは、同一クラスからの識別の少ないオブジェクトインスタンスを徐々に検出し、トレーニングに利用することができる。
論文 参考訳(メタデータ) (2020-02-04T02:11:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。