論文の概要: DiZiNER: Disagreement-guided Instruction Refinement via Pilot Annotation Simulation for Zero-shot Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2604.15866v1
- Date: Fri, 17 Apr 2026 09:16:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.851801
- Title: DiZiNER: Disagreement-guided Instruction Refinement via Pilot Annotation Simulation for Zero-shot Named Entity Recognition
- Title(参考訳): DiZiNER:Zero-shot Named Entity Recognition のためのパイロットアノテーションシミュレーションによる診断誘導型インストラクションリファインメント
- Authors: Siun Kim, Hyung-Jin Yoon,
- Abstract要約: 大規模言語モデル(LLM)は、ゼロショットおよび少数ショット名付きエンティティ認識(NER)を有効にすることで、高度な情報抽出(IE)を行う。
命令の微調整の進歩にもかかわらず、ゼロショットのNERは教師付きシステムよりずっと遅れている。
我々は、パイロットアノテーションプロセスをシミュレートするフレームワークであるDiZiNERを紹介し、LLMをアノテータとスーパーバイザの両方として利用する。
18のベンチマークで、DiZiNERは14のデータセットでゼロショットSOTA結果を達成し、事前のベストを+8.0 F1に改善し、ゼロショットから教師付きギャップを+11ポイント以上削減した。
- 参考スコア(独自算出の注目度): 0.061386715480643554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have advanced information extraction (IE) by enabling zero-shot and few-shot named entity recognition (NER), yet their generative outputs still show persistent and systematic errors. Despite progress through instruction fine-tuning, zero-shot NER still lags far behind supervised systems. These recurring errors mirror inconsistencies observed in early-stage human annotation processes that resolve disagreements through pilot annotation. Motivated by this analogy, we introduce DiZiNER (Disagreement-guided Instruction Refinement via Pilot Annotation Simulation for Zero-shot Named Entity Recognition), a framework that simulates the pilot annotation process, employing LLMs to act as both annotators and supervisors. Multiple heterogeneous LLMs annotate shared texts, and a supervisor model analyzes inter-model disagreements to refine task instructions. Across 18 benchmarks, DiZiNER achieves zero-shot SOTA results on 14 datasets, improving prior bests by +8.0 F1 and reducing the zero-shot to supervised gap by over +11 points. It also consistently outperforms its supervisor, GPT-5 mini, indicating that improvements stem from disagreement-guided instruction refinement rather than model capacity. Pairwise agreement between models shows a strong correlation with NER performance, further supporting this finding.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ゼロショットおよび少数ショット名付きエンティティ認識(NER)を有効にすることで、高度な情報抽出(IE)を行うが、生成出力は持続的かつ体系的なエラーを示す。
命令の微調整の進歩にもかかわらず、ゼロショットのNERは教師付きシステムよりずっと遅れている。
これらの繰り返しエラーは、パイロットアノテーションを通して不一致を解消する初期の人間のアノテーションプロセスで観察された矛盾を反映している。
このアナロジーに触発されたDiZiNER (Disagreement-guided Instruction Refinement via Pilot Annotation Simulation for Zero-shot Named Entity Recognition) は、パイロットアノテーションプロセスをシミュレートし、LLMを用いてアノテーションとスーパーバイザの両方として機能するフレームワークである。
複数のヘテロジニアスLSMは共有テキストに注釈を付け、スーパーバイザーモデルはモデル間不一致を分析してタスク命令を洗練させる。
18のベンチマークで、DiZiNERは14のデータセットでゼロショットSOTA結果を達成し、事前のベストを+8.0 F1に改善し、ゼロショットから教師付きギャップを+11ポイント以上削減した。
また、そのスーパーバイザーであるGPT-5 miniを一貫して上回り、改良はモデルキャパシティではなく、不一致誘導命令の改良によるものであることを示している。
モデル間のペアワイドな一致は、NERのパフォーマンスと強い相関を示し、この発見をさらに支持している。
関連論文リスト
- RAG-Zeval: Towards Robust and Interpretable Evaluation on RAG Responses through End-to-End Rule-Guided Reasoning [64.46921169261852]
RAG-Zevalは、ルール誘導推論タスクとして忠実さと正しさの評価を定式化する、新しいエンドツーエンドフレームワークである。
提案手法は、強化学習による評価者を訓練し、コンパクトなモデルにより包括的および音質評価を生成する。
実験では、RAG-Zevalの優れた性能を示し、人間の判断と最も強い相関性を達成した。
論文 参考訳(メタデータ) (2025-05-28T14:55:33Z) - A Cooperative Multi-Agent Framework for Zero-Shot Named Entity Recognition [71.61103962200666]
ゼロショット名付きエンティティ認識(NER)は、注釈のないテキストコーパスからエンティティ認識システムを開発することを目的としている。
最近の研究は、特別なプロンプトテンプレートを作成することで、ゼロショットNERに大規模な言語モデル(LLM)を適用している。
ゼロショットNERのための新しいフレームワークである協調型マルチエージェントシステム(CMAS)を紹介する。
論文 参考訳(メタデータ) (2025-02-25T23:30:43Z) - Mix of Experts Language Model for Named Entity Recognition [4.120505838411977]
我々は,Mixture of Experts (MoE)に基づく頑健なNERモデルBOND-MoEを提案する。
NER予測のために単一のモデルに頼る代わりに、複数のモデルをトレーニングし、期待-最大化フレームワークでアンサンブルする。
実世界のデータセットを用いた実験により,提案手法は,他の遠隔教師付きNERと比較して最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2024-04-30T01:41:03Z) - Rethinking Negative Instances for Generative Named Entity Recognition [24.471319308957035]
GNERはジェネレーティブNERシステムであり、見えないエンティティドメイン間でゼロショットのパフォーマンスが改善されている。
本稿では,非構造的予測を構造化エンティティに変換するために最適化したLCSマッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-26T14:30:37Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - Joint Contextual Modeling for ASR Correction and Language Understanding [60.230013453699975]
言語理解(LU)と協調してASR出力の文脈的言語補正を行うマルチタスクニューラルアプローチを提案する。
そこで本研究では,市販のASRおよびLUシステムの誤差率を,少量のドメイン内データを用いてトレーニングしたジョイントモデルと比較して14%削減できることを示した。
論文 参考訳(メタデータ) (2020-01-28T22:09:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。