論文の概要: Learning Nested Named Entity Recognition from Flat Annotations
- arxiv url: http://arxiv.org/abs/2603.00840v1
- Date: Sat, 28 Feb 2026 23:37:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.379971
- Title: Learning Nested Named Entity Recognition from Flat Annotations
- Title(参考訳): フラットアノテーションを用いたNested Named Entity Recognitionの学習
- Authors: Igor Rozhkov, Natalia Loukachevitch,
- Abstract要約: モデルがフラットアノテーションだけでネスト構造を学習できるかどうかを検討する。
NERELは、29のエンティティタイプを持つロシアのベンチマークで、21%のエンティティがネストされている。
- 参考スコア(独自算出の注目度): 0.21485350418225244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nested named entity recognition identifies entities contained within other entities, but requires expensive multi-level annotation. While flat NER corpora exist abundantly, nested resources remain scarce. We investigate whether models can learn nested structure from flat annotations alone, evaluating four approaches: string inclusions (substring matching), entity corruption (pseudo-nested data), flat neutralization (reducing false negative signal), and a hybrid fine-tuned + LLM pipeline. On NEREL, a Russian benchmark with 29 entity types where 21% of entities are nested, our best combined method achieves 26.37% inner F1, closing 40% of the gap to full nested supervision. Code is available at https://github.com/fulstock/Learning-from-Flat-Annotations.
- Abstract(参考訳): ネストされた名前付きエンティティ認識は、他のエンティティに含まれるエンティティを識別するが、高価なマルチレベルアノテーションを必要とする。
平らなNERコーパスは豊富に存在するが、営巣資源は乏しい。
本研究では,文字列包摂(サブストリングマッチング),エンティティの汚損(擬似ネストデータ),フラット中立化(偽陰性信号の低減),ハイブリッド微調整+LLMパイプラインの4つのアプローチを評価することによって,フラットアノテーションのみからネスト構造を学習できるかどうかを検討する。
NERELは、29のエンティティタイプを持ち、21%のエンティティがネストされているロシアのベンチマークである。
コードはhttps://github.com/fulstock/Learning-from-Flat-Annotationsで公開されている。
関連論文リスト
- Entity Disambiguation via Fusion Entity Decoding [68.77265315142296]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。
GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文 参考訳(メタデータ) (2024-04-02T04:27:54Z) - Lambda: Learning Matchable Prior For Entity Alignment with Unlabeled Dangling Cases [49.86384156476041]
検出とエンティティアライメントのダングリングのためのフレームワーク textitLambda を提案する。
Lambdaは、KEESAと呼ばれるGNNベースのエンコーダと、EAのスペクトルコントラスト学習と、iPULEと呼ばれる検出をダングリングするための正の未ラベル学習アルゴリズムを備えている。
論文 参考訳(メタデータ) (2024-03-16T17:21:58Z) - Taxonomy Expansion for Named Entity Recognition [65.49344005894996]
名前付きエンティティ認識(NER)モデルをトレーニングするには、しばしばエンティティタイプの分類を修正する必要がある。
単純なアプローチは、既存のエンティティタイプと追加エンティティタイプの両方でデータセット全体をアノテートすることだ。
部分的ラベルモデル(PLM)と呼ばれる,注釈付きデータセットのみを用いる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T16:23:46Z) - Recognizing Nested Entities from Flat Supervision: A New NER Subtask,
Feasibility and Challenges [3.614392310669357]
本研究では,現実的な応用シナリオに対応する新しいサブタスクであるネスト・オブ・フラットNERを提案する。
ラベル付きエンティティ内でネストされたスパンを意図的に無視し、スパンベースのモデルをトレーニングします。
トレーニングデータからネストされたエンティティを除去すると,ACE 2004,ACE 2005,GENIAの各エンティティ内のスパンのサブセットに対して54.8%,54.2%,41.1%のF1スコアが得られた。
論文 参考訳(メタデータ) (2022-11-01T06:41:42Z) - Type-supervised sequence labeling based on the heterogeneous star graph
for named entity recognition [6.25916397918329]
本稿では,テキストノードとタイプノードを含む異種星グラフの表現学習について述べる。
モデルは、グラフ内のノードを更新した後、タイプ管理シーケンスラベリングを実行する。
NERデータセットの公開実験により、フラットなエンティティとネストされたエンティティの両方を抽出する際のモデルの有効性が明らかとなった。
論文 参考訳(メタデータ) (2022-10-19T01:40:06Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Wojood: Nested Arabic Named Entity Corpus and Recognition using BERT [1.2891210250935146]
Wojoodは550K Modern Standard Arabic (MSA)と21のエンティティタイプで手動で注釈付けされた方言トークンで構成されている。
データには約75Kのエンティティが含まれ、うち22.5%がネストされている。
私たちのコーパス、アノテーションガイドライン、ソースコード、事前訓練されたモデルが公開されています。
論文 参考訳(メタデータ) (2022-05-19T16:06:49Z) - Trigger-GNN: A Trigger-Based Graph Neural Network for Nested Named
Entity Recognition [5.9049664765234295]
ネストしたNERを利用するトリガーベースグラフニューラルネットワーク(Trigger-GNN)を提案する。
エンティティトリガーエンコーディングとセマンティックマッチングを通じて補完的なアノテーション埋め込みを得る。
モデルはより効率的に、費用対効果で学習し、一般化するのに役立ちます。
論文 参考訳(メタデータ) (2022-04-12T04:15:39Z) - BoningKnife: Joint Entity Mention Detection and Typing for Nested NER
via prior Boundary Knowledge [1.5149438988761574]
ネストされたNER抽出および認識タスクをよりよく扱うために,境界知識(BoningKnife)を介して検出およびタイピングモデルに言及する共同エンティティを提案する。
BoningKnifeはMentionTaggerとTypeClassifierの2つのモジュールで構成されている。
異なるデータセットに対する実験により、我々の手法は従来の手法よりも優れており、ACE2004、ACE2005、NNEの86.41、85.46、94.2のF1スコアが達成されている。
論文 参考訳(メタデータ) (2021-07-20T11:44:36Z) - Exploring and Evaluating Attributes, Values, and Structures for Entity
Alignment [100.19568734815732]
エンティティアライメント(EA)は、さまざまなKGから等価なエンティティをリンクすることで、リッチコンテンツの統合知識グラフ(KG)を構築することを目的としている。
属性・トリプルは重要なアライメント信号も提供できますが、まだ十分に調査されていません。
本稿では,属性値エンコーダを用いてKGをサブグラフに分割し,属性の様々なタイプを効率的にモデル化することを提案する。
論文 参考訳(メタデータ) (2020-10-07T08:03:58Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z) - Named Entity Recognition as Dependency Parsing [16.544333689188246]
グラフベースの依存性解析を使用して、バフィンモデルによる入力のグローバルビューをモデルに提供します。
このモデルは,8コーパスの評価とSoTA性能の達成により,最大2.2ポイントの精度向上を達成し,ネスト型NERと平坦型NERの両方で良好に動作することを示す。
論文 参考訳(メタデータ) (2020-05-14T17:11:41Z) - Bipartite Flat-Graph Network for Nested Named Entity Recognition [94.91507634620133]
ネスト型名前付きエンティティ認識(NER)のためのバイパートフラットグラフネットワーク(BiFlaG)
ネストされた名前付きエンティティ認識(NER)のためのバイパーティライトフラットグラフネットワーク(BiFlaG)を提案する。
論文 参考訳(メタデータ) (2020-05-01T15:14:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。