Fugu-MT 論文翻訳(概要): FiNER: Financial Named Entity Recognition Dataset and Weak-Supervision Model

論文の概要: FiNER: Financial Named Entity Recognition Dataset and Weak-Supervision Model

arxiv url: http://arxiv.org/abs/2302.11157v1
Date: Wed, 22 Feb 2023 05:41:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-23 16:17:34.020458
Title: FiNER: Financial Named Entity Recognition Dataset and Weak-Supervision Model
Title（参考訳）: FiNER:ファイナンシャルネーム付きエンティティ認識データセットと弱スーパービジョンモデル
Authors: Agam Shah, Ruchit Vithani, Abhinav Gullapalli, Sudheer Chava
Abstract要約: ファイナンスドメインは、名前付き認識(NER)タスクに固有の課題を提示します。ファイナンスドメインのための最初の高品質なNERデータセットを開発する。現在の弱いスーパービジョンフレームワークを拡張して、スパンレベルの分類に使用できるようにします。
参考スコア（独自算出の注目度）: 1.7205106391379026
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The development of annotated datasets over the 21st century has helped us truly realize the power of deep learning. Most of the datasets created for the named-entity-recognition (NER) task are not domain specific. Finance domain presents specific challenges to the NER task and a domain specific dataset would help push the boundaries of finance research. In our work, we develop the first high-quality NER dataset for the finance domain. To set the benchmark for the dataset, we develop and test a weak-supervision-based framework for the NER task. We extend the current weak-supervision framework to make it employable for span-level classification. Our weak-ner framework and the dataset are publicly available on GitHub and Hugging Face.
Abstract（参考訳）: 21世紀の注釈付きデータセットの開発は、ディープラーニングのパワーを真に実現するのに役立ちました。名前付き認識(NER)タスクのために作成されたデータセットのほとんどはドメイン固有ではない。ファイナンスドメインはnerタスクに特定の課題を示し、ドメイン固有のデータセットはファイナンス研究の境界を押し上げるのに役立つでしょう。そこで本研究では,金融分野を対象とした高品質なNERデータセットを開発した。データセットのベンチマークを設定するために、NERタスクのための弱いスーパービジョンベースのフレームワークを開発し、テストする。現在の弱いスーパービジョンフレームワークを拡張して、スパンレベルの分類に使用できるようにします。私たちの弱いフレームワークとデータセットはgithubで公開されています。

関連論文リスト

OpenNER 1.0: Standardized Open-Access Named Entity Recognition Datasets in 50+ Languages [9.114488614939619]
オープンに利用可能なエンティティ認識(NER)データセットの標準化されたコレクションであるOpenNER 1.0を提示する。我々は、元のデータセットを一様表現に標準化し、コーパス間でより一貫性のあるエンティティタイプ名をマップし、多言語マルチオントロジーNERの研究を可能にする構造でコレクションを提供する。
論文参考訳（メタデータ） (2024-12-12T18:55:53Z)
DynamicNER: A Dynamic, Multilingual, and Fine-Grained Dataset for LLM-based Named Entity Recognition [53.019885776033824]
動的分類を伴うLarge Language Models (LLM) ベースの手法のために設計された最初のNERデータセットであるDynamicNERを提案する。データセットは多言語および多言語で、8言語と155のエンティティタイプをカバーし、コーパスはさまざまなドメインにまたがる。実験によると、DynamicNERはLLMベースのNERメソッドの堅牢で効果的なベンチマークとして機能している。
論文参考訳（メタデータ） (2024-09-17T09:32:12Z)
MSciNLI: A Diverse Benchmark for Scientific Natural Language Inference [65.37685198688538]
本稿では,5つの科学領域から抽出した132,320の文対を含むデータセットであるMSciNLIについて述べる。我々は、微調整事前学習言語モデル(PLM)とLarge Language Model(LLM)によるMSciNLIの強力なベースラインを確立する。ドメインシフトは、データセット内の異なるドメインの多様な特性を示す科学的なNLIモデルの性能を低下させることを示す。
論文参考訳（メタデータ） (2024-04-11T18:12:12Z)
NERetrieve: Dataset for Next Generation Named Entity Recognition and Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。 500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文参考訳（メタデータ） (2023-10-22T12:23:00Z)
T-NER: An All-Round Python Library for Transformer-based Named Entity Recognition [9.928025283928282]
T-NERは、NER LMファインタニング用のPythonライブラリである。 9つのパブリックなNERデータセットを統一されたフォーマットにコンパイルすることで、ライブラリの可能性を示す。将来の研究を容易にするため、Hugging Faceモデルハブを通じてLMチェックポイントをすべてリリースしています。
論文参考訳（メタデータ） (2022-09-09T15:00:38Z)
MultiCoNER: A Large-scale Multilingual dataset for Complex Named Entity Recognition [15.805414696789796]
我々は、11言語にわたる3つのドメイン(ウィキ文、質問、検索クエリ)をカバーする、名前付きエンティティ認識のための大規模な多言語データセットであるMultiCoNERを提案する。このデータセットは、低コンテキストシナリオを含む、NERの現代的課題を表現するように設計されている。
論文参考訳（メタデータ） (2022-08-30T20:45:54Z)
Nested Named Entity Recognition as Holistic Structure Parsing [92.8397338250383]
本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
論文参考訳（メタデータ） (2022-04-17T12:48:20Z)
Unified Named Entity Recognition as Word-Word Relation Classification [25.801945832005504]
我々は、統一NERを単語関係分類、すなわちW2NERとしてモデル化する新しい方法を提案する。このアーキテクチャは、エンティティワード間の隣り合う関係を効果的にモデル化することにより、統一NERのカーネルボトルネックを解決する。 W2NERスキームに基づいて,統一NERを単語ペアの2次元グリッドとしてモデル化するニューラルネットワークフレームワークを開発する。
論文参考訳（メタデータ） (2021-12-19T06:11:07Z)
Simple Questions Generate Named Entity Recognition Datasets [18.743889213075274]
この研究は、単純な自然言語の質問によってNERデータセットを自動的に生成する、要求対生成のアプローチを導入している。我々のモデルは、4つの異なる領域にわたる6つのNERベンチマークにおいて、以前の弱い教師付きモデルよりも大幅に優れています。自然言語でNERのニーズを定式化することで、アワードのようなきめ細かいエンティティタイプのためのNERモデルを構築することもできます。
論文参考訳（メタデータ） (2021-12-16T11:44:38Z)
An Open-Source Dataset and A Multi-Task Model for Malay Named Entity Recognition [3.511753382329252]
マレーNERデータセット(MYNER)を28,991文(384万個以上)で構築する。 NERトレーニングを明示的かつ暗黙的に改善するために、補助的なタスクである境界検出が導入されている。
論文参考訳（メタデータ） (2021-09-03T03:29:25Z)
Reinforced Iterative Knowledge Distillation for Cross-Lingual Named Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文参考訳（メタデータ） (2021-06-01T05:46:22Z)
MasakhaNER: Named Entity Recognition for African Languages [48.34339599387944]
アフリカで10の言語で名前付きエンティティ認識のための、最初の大規模な公開可能な高品質データセットを作成します。我々は,これらの言語がNERにもたらす課題を理解するために,言語の特徴を詳述する。
論文参考訳（メタデータ） (2021-03-22T13:12:44Z)
Zero-Resource Cross-Domain Named Entity Recognition [68.83177074227598]
既存のドメイン名付きエンティティ認識モデルは、多くのラベルなしコーパスや、ターゲットドメイン内のラベル付きNERトレーニングデータに依存している。外部リソースを一切使用しないドメイン間NERモデルを提案する。
論文参考訳（メタデータ） (2020-02-14T09:04:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。