論文の概要: Scaling Performance and Low-Resource Annotation with Many-Shot In-Context Learning for Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2606.21890v1
- Date: Sat, 20 Jun 2026 05:39:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 21:53:28.440867
- Title: Scaling Performance and Low-Resource Annotation with Many-Shot In-Context Learning for Named Entity Recognition
- Title(参考訳): 名前付きエンティティ認識のためのマルチショットインコンテキスト学習によるスケールパフォーマンスと低リソースアノテーション
- Authors: Qi Zhang, Fangping Lan, Cornelia Caragea, Longin Jan Latecki, Eduard Dragut,
- Abstract要約: 大規模言語モデル(LLM)を用いたインコンテキスト学習(ICL)は、名前付きエンティティ認識(NER)のための微調整の強力な代替手段として登場した。
我々は,NER 用多ショット ICL の包括的調査を行い,低リソース NER タスクのアノテートおよび精細化におけるその有効性について検討する。
実験では, 1) 数百のインコンテキスト例へのスケーリングにより, LLM が完全教師付きBERT モデルの性能にマッチしたり,さらに超えたりすることができること,(2) 約 100 人のラベル付きサンプルをデモとして使用することにより,マルチショットインコンテキストアノテーションが高品質なラベル付きラベルを生成可能であること,などが実証された。
- 参考スコア(独自算出の注目度): 52.07624601400713
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In-context learning (ICL) with large language models (LLMs) has emerged as a powerful alternative to fine-tuning for Named Entity Recognition (NER), achieving strong performance with minimal annotation and no additional training. However, prior work has shown that despite their adaptability, LLMs still lag behind fully supervised models such as fine-tuned BERT in structured tasks like NER. While existing studies on ICL for NER have mainly explored few-shot settings, the potential of scaling to hundreds of demonstrations has not been thoroughly investigated. To address this gap, we conduct a comprehensive investigation of many-shot ICL for NER and further explore its effectiveness in annotating and refining data for low-resource NER tasks. Specifically, we evaluate various LLMs across multiple domains using hundreds of ICL examples and then assess the feasibility of using many-shot ICL as a data annotation framework. Our experiments demonstrate that: (1) scaling to hundreds of in-context examples enables LLMs to match or even surpass the performance of fully supervised BERT models; and (2) using about one hundred human-labeled examples as demonstrations, many-shot in-context annotation can generate high-quality labeled data, leading to approximately 10% absolute F1 improvement over existing state-of-the-art approaches when used to fine-tune BERT on low-resource NER.
- Abstract(参考訳): 大規模言語モデル(LLMs)を備えたインコンテキスト学習(ICL)は、名前付きエンティティ認識(NER)の微調整の強力な代替手段として現れ、最小限のアノテーションと追加のトレーニングなしで強力なパフォーマンスを実現している。
しかし、以前の研究によると、LLMは適応性にも拘わらず、NERのような構造化タスクにおいて、細調整のBERTのような完全な教師付きモデルに遅れを取っている。
NERのためのICLに関する既存の研究は、主に数ショット設定を探索してきたが、数百のデモにスケールする可能性については、十分には研究されていない。
このギャップに対処するため、我々は、NERのための多ショットICLを包括的に調査し、低リソースのNERタスクのアノテートおよび精細化におけるその有効性について検討する。
具体的には、数百のICL例を用いて、複数のドメインにまたがる様々なLCMを評価し、マルチショットICLをデータアノテーションフレームワークとしての有用性を評価する。
実験では, 1) 数百のコンテキスト内サンプルへのスケーリングにより, LLM が完全教師付きBERT モデルの性能に適合したり,あるいは超越したりすること,(2) 約100人のラベル付きサンプルをデモとして使用することにより,マルチショットインコンテキストアノテーションは高品質なラベル付きデータを生成することができ,低リソース NER 上でBERT を微調整する場合に,既存の最先端アプローチに比べて約10%の絶対的な F1 改善をもたらすことを実証した。
関連論文リスト
- LLMs are Better Than You Think: Label-Guided In-Context Learning for Named Entity Recognition [10.920384665824807]
In-context Learning (ICL) では、大規模な言語モデルで新しいタスクを実行することができる。
既存のICLメソッドは通常、実演検索にタスクに依存しないセマンティックな類似性に依存している。
トレーニング不要なICLアプローチであるDEERを導入し,LCMがより知的なエンティティ予測を行えるようにした。
論文 参考訳(メタデータ) (2025-05-29T17:54:32Z) - MAPLE: Many-Shot Adaptive Pseudo-Labeling for In-Context Learning [53.02571749383208]
In-Context Learning (ICL)は、大規模言語モデル(LLM)に複数のインプット・アウトプット・サンプルを組み込むことで、多様なタスクに対処する権限を与える。
Many-Shot Adaptive Pseudo-LabEling (MAPLE)は、ラベル情報の欠如を補うために擬似ラベル付きサンプルを利用する新しいインフルエンスベースのマルチショットICLフレームワークである。
論文 参考訳(メタデータ) (2025-05-22T04:54:27Z) - Scaling Laws for Many-Shot In-Context Learning with Self-Generated Annotations [37.62305582749307]
本研究では,従来の半教師付き学習に類似した枠組みを用いて,自己生成例を用いたインコンテキスト学習について検討する。
本フレームワークでは,ゼロショット,少数ショット,多ショット設定において,グランドトルースICLよりも優れた単純なベースラインを提案する。
本稿では,反復的洗練と擬似ラベル技術を統合する反復的アノテーション手法であるIterPSDを紹介する。
論文 参考訳(メタデータ) (2025-03-04T23:52:49Z) - PICLe: Pseudo-Annotations for In-Context Learning in Low-Resource Named Entity Detection [56.916656013563355]
In-context Learning (ICL)により、大規模言語モデルでは、デモをほとんど使わずにタスクを実行することができる。
PICLeは、ノイズの多い擬似アノテーション付き実演によるインコンテキスト学習のためのフレームワークである。
バイオメディカルな5つのNEDデータセット上でPICLeを評価し,PICLeが低リソース環境でICLより優れていることを示す。
論文 参考訳(メタデータ) (2024-12-16T16:09:35Z) - On Many-Shot In-Context Learning for Long-Context Evaluation [10.500629810624769]
本稿では,マルチショットICLによる長文言語モデルの評価について検討する。
ICLタスクを共通サンプル学習(SSL)と全サンプル学習(ASL)の2つのグループに分類するメトリクスを開発する。
最先端のモデルではSSLタスクで64kトークンまでパフォーマンスが向上するが、ASLタスクで16kトークンしかなかったため、多くのモデルは大幅なパフォーマンス低下を経験している。
論文 参考訳(メタデータ) (2024-11-11T17:00:59Z) - C-ICL: Contrastive In-context Learning for Information Extraction [54.39470114243744]
c-ICLは、正しいサンプル構築と間違ったサンプル構築の両方を活用して、コンテキスト内学習のデモを作成する、新しい数ショット技術である。
各種データセットに対する実験により,c-ICLは従来の数発のインコンテキスト学習法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-02-17T11:28:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。