論文の概要: Low-Resource Named Entity Recognition: Can One-vs-All AUC Maximization
Help?
- arxiv url: http://arxiv.org/abs/2311.04918v1
- Date: Thu, 2 Nov 2023 10:14:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-12 19:19:39.667732
- Title: Low-Resource Named Entity Recognition: Can One-vs-All AUC Maximization
Help?
- Title(参考訳): 低リソース名前付きエンティティ認識: AUCの最大化は有効か?
- Authors: Ngoc Dang Nguyen, Wei Tan, Lan Du, Wray Buntine, Richard Beare,
Changyou Chen
- Abstract要約: 我々は,1-vs-all(OVA)学習問題として,マルチクラス問題の革新的再構成を提案し,受信動作特性曲線(AUC)の下での領域に基づく損失関数を提案する。
OVAに基づくアプローチの効率を高めるために,類似言語特性を持つグループラベルとメタラーニングを用いたグループラベルの2つのトレーニング戦略を提案する。
提案手法の優位性は,NER設定の異なる従来のNER学習を超越した性能によって確認される。
- 参考スコア(独自算出の注目度): 29.925539498551046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity recognition (NER), a task that identifies and categorizes named
entities such as persons or organizations from text, is traditionally framed as
a multi-class classification problem. However, this approach often overlooks
the issues of imbalanced label distributions, particularly in low-resource
settings, which is common in certain NER contexts, like biomedical NER
(bioNER). To address these issues, we propose an innovative reformulation of
the multi-class problem as a one-vs-all (OVA) learning problem and introduce a
loss function based on the area under the receiver operating characteristic
curve (AUC). To enhance the efficiency of our OVA-based approach, we propose
two training strategies: one groups labels with similar linguistic
characteristics, and another employs meta-learning. The superiority of our
approach is confirmed by its performance, which surpasses traditional NER
learning in varying NER settings.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、個人や組織などの名前付きエンティティをテキストから識別し分類するタスクであり、伝統的に複数のクラスに分類される。
しかし、このアプローチは、特にバイオメディカルNER(bioNER)のような特定のNERコンテキストで一般的な低リソース設定において、不均衡なラベル分布の問題を見落としていることが多い。
これらの問題に対処するために,単元vs-all(ova)学習問題としての多クラス問題の革新的再構成を提案し,受信者の動作特性曲線(auc)の下の領域に基づく損失関数を導入する。
OVAに基づくアプローチの効率を高めるために,類似した言語特性を持つグループラベルとメタラーニングを用いた2つのトレーニング戦略を提案する。
提案手法の優位性は,NER設定の異なる従来のNER学習を上回る性能で確認される。
関連論文リスト
- Noise Contrastive Estimation-based Matching Framework for Low-Resource
Security Attack Pattern Recognition [49.536368818512116]
TTP(Tactics, Techniques and Procedures)は、サイバーセキュリティドメインにおける高度な攻撃パターンを表す。
そこで本研究では,TTPラベルへのテキストの割り当てが,両者の直接的な意味的類似性によって決定される,異なる学習パラダイムの問題を定式化する。
本稿では,効果的なサンプリングベース学習機構を備えたニューラルマッチングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-18T19:02:00Z) - Incorporating Class-based Language Model for Named Entity Recognition in Factorized Neural Transducer [50.572974726351504]
クラスベースのLMをFNTに組み込んだ新しいE2EモデルであるC-FNTを提案する。
C-FNTでは、名前付きエンティティのLMスコアは、その表面形式の代わりに名前クラスに関連付けることができる。
実験の結果,提案したC-FNTは,単語認識の性能を損なうことなく,名前付きエンティティの誤りを著しく低減することがわかった。
論文 参考訳(メタデータ) (2023-09-14T12:14:49Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Learning "O" Helps for Learning More: Handling the Concealed Entity
Problem for Class-incremental NER [23.625741716498037]
「ラベルなしエンティティ問題」は「O」と「エンティティ」の間に深刻な混乱をもたらす。
我々は「O」におけるエンティティクラスタを適応的に検出するエンティティ対応コントラスト学習手法を提案する。
クラスインクリメンタルなNERに対して,より現実的で挑戦的なベンチマークを導入する。
論文 参考訳(メタデータ) (2022-10-10T13:26:45Z) - Orchestra: Unsupervised Federated Learning via Globally Consistent
Clustering [15.219936378115218]
Orchestraは、フェデレーションの階層を利用して分散クラスタリングタスクをオーケストレーションする、新しい教師なしのフェデレーション学習技術である。
線形プローブ下でのアルゴリズムパイプラインにより,優れた一般化性能が保証されることを示す。
論文 参考訳(メタデータ) (2022-05-23T17:59:03Z) - Feature Diversity Learning with Sample Dropout for Unsupervised Domain
Adaptive Person Re-identification [0.0]
本稿では,ノイズの多い擬似ラベルを限定することで,より優れた一般化能力を持つ特徴表現を学習する手法を提案する。
我々は,古典的な相互学習アーキテクチャの下で,FDL(Feature Diversity Learning)と呼ばれる新しい手法を提案する。
実験の結果,提案するFDL-SDは,複数のベンチマークデータセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-01-25T10:10:48Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - MultiFair: Multi-Group Fairness in Machine Learning [52.24956510371455]
機械学習におけるマルチグループフェアネスの研究(MultiFair)
この問題を解決するために,汎用的なエンドツーエンドのアルゴリズムフレームワークを提案する。
提案するフレームワークは多くの異なる設定に一般化可能である。
論文 参考訳(メタデータ) (2021-05-24T02:30:22Z) - Learning from Self-Discrepancy via Multiple Co-teaching for Cross-Domain
Person Re-Identification [12.106894735305714]
ドメイン適応者再IDのための複数コティーチングフレームワークを提案する。
本手法は最先端技術と比較して競争力が向上する。
論文 参考訳(メタデータ) (2021-04-06T03:12:11Z) - Self-paced Contrastive Learning with Hybrid Memory for Domain Adaptive
Object Re-ID [55.21702895051287]
ドメイン適応オブジェクトre-IDは、学習した知識をラベル付けされたソースドメインからラベル付けされていないターゲットドメインに転送することを目的としています。
本稿では,ハイブリットメモリを用いた自己評価型コントラスト学習フレームワークを提案する。
提案手法は,オブジェクトre-IDの複数のドメイン適応タスクにおいて,最先端の処理性能を向上する。
論文 参考訳(メタデータ) (2020-06-04T09:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。