論文の概要: SCANNER: Knowledge-Enhanced Approach for Robust Multi-modal Named Entity Recognition of Unseen Entities
- arxiv url: http://arxiv.org/abs/2404.01914v1
- Date: Tue, 2 Apr 2024 13:05:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-03 16:28:46.606435
- Title: SCANNER: Knowledge-Enhanced Approach for Robust Multi-modal Named Entity Recognition of Unseen Entities
- Title(参考訳): SCANNER: 未知のエンティティのロバストなマルチモーダル名前付きエンティティ認識のための知識強化アプローチ
- Authors: Hyunjong Ok, Taeho Kil, Sukmin Seo, Jaeho Lee,
- Abstract要約: 3つのNER変種を効果的に扱えるモデルであるSCANNERを提案する。
SCANNERは2段階構造であり、最初の段階でエンティティ候補を抽出し、知識を得るためにクエリとして使用する。
NERデータセットのノイズの多いアノテーションから生じる課題に対処するために,新しい自己蒸留法を提案する。
- 参考スコア(独自算出の注目度): 10.193908215351497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in named entity recognition (NER) have pushed the boundary of the task to incorporate visual signals, leading to many variants, including multi-modal NER (MNER) or grounded MNER (GMNER). A key challenge to these tasks is that the model should be able to generalize to the entities unseen during the training, and should be able to handle the training samples with noisy annotations. To address this obstacle, we propose SCANNER (Span CANdidate detection and recognition for NER), a model capable of effectively handling all three NER variants. SCANNER is a two-stage structure; we extract entity candidates in the first stage and use it as a query to get knowledge, effectively pulling knowledge from various sources. We can boost our performance by utilizing this entity-centric extracted knowledge to address unseen entities. Furthermore, to tackle the challenges arising from noisy annotations in NER datasets, we introduce a novel self-distillation method, enhancing the robustness and accuracy of our model in processing training data with inherent uncertainties. Our approach demonstrates competitive performance on the NER benchmark and surpasses existing methods on both MNER and GMNER benchmarks. Further analysis shows that the proposed distillation and knowledge utilization methods improve the performance of our model on various benchmarks.
- Abstract(参考訳): 名前付きエンティティ認識(NER)の最近の進歩は、タスクの境界を視覚信号に組み込むように押し付け、マルチモーダルNER(MNER)やグラウンドドMNER(GMNER)など多くのバリエーションを生み出している。
これらのタスクの重要な課題は、トレーニング中に見つからないエンティティにモデルを一般化し、ノイズの多いアノテーションでトレーニングサンプルを処理できることである。
この障害に対処するために,3つのNER変種を効果的に扱えるモデルであるSCANNER(Span CANdidate Detection and Recognition for NER)を提案する。
SCANNERは2段階構造であり、まずエンティティ候補を抽出し、知識を得るためのクエリとして利用し、様々な情報源から効果的に知識を引き出す。
このエンティティ中心の抽出された知識を利用して、目に見えないエンティティに対処することで、パフォーマンスを向上させることができます。
さらに,NERデータセットにおけるノイズの多いアノテーションから生じる課題に対処するため,不確実性のあるトレーニングデータ処理におけるモデルの堅牢性と正確性を向上させる,新しい自己蒸留手法を提案する。
提案手法は,NERベンチマーク上での競合性能を示し,MNERベンチマークとGMNERベンチマークの両方の既存手法を上回ります。
さらに分析した結果, 提案した蒸留法と知識利用法により, 種々のベンチマークにおいて, モデルの性能が向上することがわかった。
関連論文リスト
- In-Context Learning for Few-Shot Nested Named Entity Recognition [53.55310639969833]
数発のネストネストNERの設定に有効で革新的なICLフレームワークを導入する。
我々は、新しい実演選択機構であるEnDe retrieverを考案し、ICLプロンプトを改善する。
EnDe検索では,意味的類似性,境界類似性,ラベル類似性という3種類の表現学習を行うために,コントラスト学習を用いる。
論文 参考訳(メタデータ) (2024-02-02T06:57:53Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - ContrastNER: Contrastive-based Prompt Tuning for Few-shot NER [0.6562256987706128]
本稿では、離散トークンと連続トークンの両方をプロンプトに用い、コントラストNERというプロンプトベースのNERフレームワークを提案し、コントラスト学習アプローチを用いて連続プロンプトの学習とエンティティタイプ予測を行う。
実験結果から,ContrastNERは,高リソース環境での最先端NER手法の競合性能と,低リソース環境での最先端NERモデルよりも優れた性能を示し,迅速な工学設計や言語化設計を必要としない。
論文 参考訳(メタデータ) (2023-05-29T08:24:42Z) - E-NER: Evidential Deep Learning for Trustworthy Named Entity Recognition [69.87816981427858]
ほとんどの名前付きエンティティ認識(NER)システムは、モデル不確実性を定量化する必要性を無視して、モデルパフォーマンスの改善に重点を置いている。
Evidential Deep Learning (EDL) は、最近、分類タスクの予測不確実性を明示的にモデル化するための有望な解決策として提案されている。
本稿では、従来のEDLに2つの不確実性誘導損失条件を導入し、一連の不確実性誘導訓練戦略を導入することにより、E-NERという信頼性の高いNERフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-29T02:36:16Z) - Multi-task Transformer with Relation-attention and Type-attention for
Named Entity Recognition [35.44123819012004]
名前付きエンティティ認識(NER)は自然言語処理において重要な研究課題である。
本稿では,エンティティ境界検出タスクを名前付きエンティティ認識タスクに組み込むマルチタスク変換器を提案する。
論文 参考訳(メタデータ) (2023-03-20T05:11:22Z) - MINER: Improving Out-of-Vocabulary Named Entity Recognition from an
Information Theoretic Perspective [57.19660234992812]
NERモデルは標準のNERベンチマークで有望な性能を達成した。
近年の研究では、従来のアプローチはエンティティ参照情報に過度に依存し、OoV(out-of-vocabulary)エンティティ認識の性能が劣っていることが示されている。
我々は、情報理論の観点からこの問題を改善するための新しいNER学習フレームワークであるMINERを提案する。
論文 参考訳(メタデータ) (2022-04-09T05:18:20Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant
Supervision [49.42215511723874]
我々は,NERモデルの予測性能を改善するための新しい計算フレームワーク,BONDを提案する。
具体的には,2段階の学習アルゴリズムを提案する。第1段階では,遠隔ラベルを用いて,事前学習された言語モデルをNERタスクに適用する。
第2段階では,遠隔ラベルを廃止し,モデル性能をさらに向上するための自己学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T04:55:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。