論文の概要: KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports
- arxiv url: http://arxiv.org/abs/2208.02140v1
- Date: Wed, 3 Aug 2022 15:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 13:04:27.592325
- Title: KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports
- Title(参考訳): kpi-bert: 財務報告のためのエンティティ認識と関係抽出モデル
- Authors: Lars Hillebrand, Tobias Deu{\ss}er, Tim Dilmaghani, Bernd Kliem,
R\"udiger Loitz, Christian Bauckhage, Rafet Sifa
- Abstract要約: 変換器からの双方向表現(BERT)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを提案する。
BERTは、リカレントニューラルネットワーク(RNN)と条件付きラベルマスクを組み合わせることで、関係を分類する前にエンティティをシーケンシャルにタグ付けする。
我々は、ドイツ財務報告の新しい実践的データセットにおいて、かなり高い予測性能を達成し、いくつかの強力なベースラインを上回ります。
- 参考スコア(独自算出の注目度): 1.7575422764391646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present KPI-BERT, a system which employs novel methods of named entity
recognition (NER) and relation extraction (RE) to extract and link key
performance indicators (KPIs), e.g. "revenue" or "interest expenses", of
companies from real-world German financial documents. Specifically, we
introduce an end-to-end trainable architecture that is based on Bidirectional
Encoder Representations from Transformers (BERT) combining a recurrent neural
network (RNN) with conditional label masking to sequentially tag entities
before it classifies their relations. Our model also introduces a learnable
RNN-based pooling mechanism and incorporates domain expert knowledge by
explicitly filtering impossible relations. We achieve a substantially higher
prediction performance on a new practical dataset of German financial reports,
outperforming several strong baselines including a competing state-of-the-art
span-based entity tagging approach.
- Abstract(参考訳): 実世界のドイツ財務文書から企業のキーパフォーマンス指標(KPI)を抽出・リンクするために、名前付きエンティティ認識(NER)と関係抽出(RE)という新しい手法を用いたKPI-BERTを提案する。
具体的には、リカレントニューラルネットワーク(RNN)と条件付きラベルマスキングを組み合わせたBERT(Bidirectional Encoder Representations from Transformers)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを導入し、それらの関係を分類する前にエンティティを逐次タグ付けする。
また、学習可能なRNNベースのプール機構を導入し、不可能な関係を明示的にフィルタリングすることでドメインエキスパートの知識を取り入れる。
我々は、ドイツの財務報告の新しい実践的データセットにおいて、非常に高い予測性能を達成し、競合する最先端のスパンベースのエンティティタギングアプローチを含む、いくつかの強力なベースラインを上回ります。
関連論文リスト
- FinGPT: Instruction Tuning Benchmark for Open-Source Large Language
Models in Financial Datasets [9.714447724811842]
本稿では,オープンソースの大規模言語モデルに対して,インストラクションチューニングパラダイムに固有のアプローチを導入する。
私たちは、オープンソースのモデルの相互運用性に乗じて、シームレスで透過的な統合を確保します。
本稿では,エンドツーエンドのトレーニングとテストのためのベンチマーク手法を提案し,費用対効果を生かした。
論文 参考訳(メタデータ) (2023-10-07T12:52:58Z) - A Confidence-based Partial Label Learning Model for Crowd-Annotated
Named Entity Recognition [74.79785063365289]
名前付きエンティティ認識(NER)のための既存のモデルは、主に大規模ラベル付きデータセットに基づいている。
我々は,クラウドアノテートNERに対する先行信頼度(アノテータによる提案)と後続信頼度(モデルによる学習)を統合するために,信頼に基づく部分ラベル学習(CPLL)手法を提案する。
論文 参考訳(メタデータ) (2023-05-21T15:31:23Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents [1.7575422764391646]
本稿では,Electronic Data Gathering, Analysis, and Retrieval (EDGAR)システムにアップロードされた財務報告に基づいて,共同名称のエンティティ認識と関係抽出のための新しいデータセットを提案する。
主な目的は、財務文書からキーパフォーマンス指標(KPI)を抽出し、それらの数値や他の属性にリンクすることである。
単語レベルの重み付け方式を従来のF1スコアに組み込むことで,抽出プロセスの成功度を計測する手法を提案する。
論文 参考訳(メタデータ) (2022-10-17T15:06:20Z) - Understanding the Relation of User and News Representations in
Content-Based Neural News Recommendation [0.0]
ユーザと候補者のニュース表現をマッチングする最も広く使われている手段が十分に表現できないという仮説を評価する。
幅広いベースラインと確立されたシステムにまたがって、AUCの約6ポイントが一貫した改善をもたらす。
かなり単純なベースラインモデルは、MINDデータセットの68% AUCよりもはるかに高くスコアされ、公開された最先端の2ポイント以内である。
論文 参考訳(メタデータ) (2022-07-29T14:24:25Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Enhancing the Generalization for Intent Classification and Out-of-Domain
Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である
近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。
本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2021-06-28T08:27:38Z) - Learning Intents behind Interactions with Knowledge Graph for
Recommendation [93.08709357435991]
知識グラフ(KG)は、推薦システムにおいてますます重要な役割を果たす。
既存のGNNベースのモデルは、きめ細かいインテントレベルでのユーザ項目関係の特定に失敗します。
本稿では,新しいモデルである知識グラフベースインテントネットワーク(kgin)を提案する。
論文 参考訳(メタデータ) (2021-02-14T03:21:36Z) - A Frustratingly Easy Approach for Entity and Relation Extraction [25.797992240847833]
本稿では,エンティティと関係抽出のための簡単なパイプライン化手法を提案する。
標準ベンチマーク(ACE04、ACE05、SciERC)における新しい最先端技術を確立する。
このアプローチは基本的に2つの独立したエンコーダ上に構築され、単にエンティティモデルを使用して関係モデルの入力を構築します。
論文 参考訳(メタデータ) (2020-10-24T07:14:01Z) - Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。
成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。
GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文 参考訳(メタデータ) (2020-03-02T15:58:46Z) - Linking Bank Clients using Graph Neural Networks Powered by Rich
Transactional Data [2.1169216065483996]
本稿では,ネットワークのトポロジ構造だけでなく,グラフノードやエッジで利用可能な豊富な時系列データを利用する新しいグラフニューラルネットワークモデルを提案する。
提案手法は既存の手法よりも優れており,リンク予測問題におけるROC AUCスコアの差が大きく,信用スコアの質の向上も可能である。
論文 参考訳(メタデータ) (2020-01-23T10:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。