論文の概要: Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study
- arxiv url: http://arxiv.org/abs/2401.10825v2
- Date: Mon, 11 Nov 2024 15:45:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:05:50.814358
- Title: Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study
- Title(参考訳): 名前付きエンティティ認識の最近の進歩 : 包括的調査と比較研究
- Authors: Imed Keraghel, Stanislas Morbieu, Mohamed Nadif,
- Abstract要約: NERに対する最近のポピュラーなアプローチの概要を紹介する。
我々は、強化学習とグラフベースのアプローチについて論じ、NERの性能向上におけるそれらの役割を強調した。
我々は,異なる特徴を持つ各種データセット上での主NER実装の性能を評価する。
- 参考スコア(独自算出の注目度): 8.91661466156389
- License:
- Abstract: Named Entity Recognition seeks to extract substrings within a text that name real-world objects and to determine their type (for example, whether they refer to persons or organizations). In this survey, we first present an overview of recent popular approaches, including advancements in Transformer-based methods and Large Language Models (LLMs) that have not had much coverage in other surveys. In addition, we discuss reinforcement learning and graph-based approaches, highlighting their role in enhancing NER performance. Second, we focus on methods designed for datasets with scarce annotations. Third, we evaluate the performance of the main NER implementations on a variety of datasets with differing characteristics (as regards their domain, their size, and their number of classes). We thus provide a deep comparison of algorithms that have never been considered together. Our experiments shed some light on how the characteristics of datasets affect the behavior of the methods we compare.
- Abstract(参考訳): Named Entity Recognitionは、現実世界のオブジェクトを名付けるテキスト内でサブストリングを抽出し、それらのタイプ(例えば、人や組織を指すかどうか)を決定する。
本調査では、トランスフォーマー方式の進歩や、他の調査ではあまり取り上げられていない大規模言語モデル(LLM)など、最近の一般的なアプローチの概要を概説する。
さらに、強化学習とグラフベースのアプローチについて論じ、NERの性能向上におけるその役割を強調した。
第二に、アノテーションの少ないデータセット用に設計された手法に焦点を当てる。
第3に,異なる特徴(ドメイン,サイズ,クラス数など)を持つデータセットに対して,主要なNER実装の性能を評価する。
したがって、これまで一緒に検討されたことのないアルゴリズムを深く比較する。
実験では、データセットの特徴が、比較した手法の振る舞いにどのように影響するかについて光を当てました。
関連論文リスト
- Benchmarking a Benchmark: How Reliable is MS-COCO? [0.0]
MS-COCOの再注釈であるSama-COCOは、形状解析パイプラインを利用して潜在的なバイアスを発見するために用いられる。
モデルは、異なるアノテーション条件の影響を調べるために、両方のデータセットでトレーニングされ、評価される。
論文 参考訳(メタデータ) (2023-11-05T16:55:40Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - DeepAstroUDA: Semi-Supervised Universal Domain Adaptation for
Cross-Survey Galaxy Morphology Classification and Anomaly Detection [0.0]
本稿では,この課題を克服するためのアプローチとして,ユニバーサルドメイン適応手法であるtextitDeepAstroUDAを提案する。
textitDeepAstroUDAは、2つの天文学的な調査のギャップを埋め、両方のドメインの分類精度を高めることができる。
また,本手法は異常検出アルゴリズムや未知のクラスサンプルのクラスタ化にも有効である。
論文 参考訳(メタデータ) (2023-02-03T21:20:58Z) - RGB-D-Based Categorical Object Pose and Shape Estimation: Methods,
Datasets, and Evaluation [5.71097144710995]
この研究は、メソッド、データセット、評価プロトコルの観点から、この分野の概要を提供する。
我々は、メトリクスやデータセットを含む主要な評価プロトコルを批判的に見ていく。
我々は、新しいメトリクスセットを提案し、Redwoodデータセットに新しいアノテーションを提供し、公正な比較で最先端の手法を評価する。
論文 参考訳(メタデータ) (2023-01-19T15:59:10Z) - Revisiting Contrastive Methods for Unsupervised Learning of Visual
Representations [78.12377360145078]
対照的な自己教師型学習は、セグメンテーションやオブジェクト検出といった多くの下流タスクにおいて教師付き事前訓練よりも優れています。
本稿では,データセットのバイアスが既存手法にどのように影響するかを最初に検討する。
現在のコントラストアプローチは、(i)オブジェクト中心対シーン中心、(ii)一様対ロングテール、(iii)一般対ドメイン固有データセットなど、驚くほどうまく機能することを示す。
論文 参考訳(メタデータ) (2021-06-10T17:59:13Z) - SegmentMeIfYouCan: A Benchmark for Anomaly Segmentation [111.61261419566908]
ディープニューラルネットワーク(DNN)は通常、閉集合のセマンティッククラスで訓練される。
未発見のオブジェクトを扱うには不備だ。
このような物体の検出と局在化は、自動運転の認識などの安全クリティカルなアプリケーションに不可欠です。
論文 参考訳(メタデータ) (2021-04-30T07:58:19Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - A Critical Assessment of State-of-the-Art in Entity Alignment [1.7725414095035827]
本稿では,知識グラフにおけるエンティティアライメントのタスクに対する2つの最先端(SotA)手法について検討する。
まず、ベンチマークプロセスについて慎重に検討し、いくつかの欠点を特定した。
論文 参考訳(メタデータ) (2020-10-30T15:09:19Z) - Sensor Data for Human Activity Recognition: Feature Representation and
Benchmarking [27.061240686613182]
HAR(Human Activity Recognition)の分野は、監視装置(センサなど)から取得したデータを取得し、分析することに焦点を当てている。
我々は、異なる機械学習(ML)技術を用いて、人間のアクティビティを正確に認識する問題に対処する。
論文 参考訳(メタデータ) (2020-05-15T00:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。