論文の概要: KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports
- arxiv url: http://arxiv.org/abs/2208.02140v1
- Date: Wed, 3 Aug 2022 15:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 13:04:27.592325
- Title: KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports
- Title(参考訳): kpi-bert: 財務報告のためのエンティティ認識と関係抽出モデル
- Authors: Lars Hillebrand, Tobias Deu{\ss}er, Tim Dilmaghani, Bernd Kliem,
R\"udiger Loitz, Christian Bauckhage, Rafet Sifa
- Abstract要約: 変換器からの双方向表現(BERT)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを提案する。
BERTは、リカレントニューラルネットワーク(RNN)と条件付きラベルマスクを組み合わせることで、関係を分類する前にエンティティをシーケンシャルにタグ付けする。
我々は、ドイツ財務報告の新しい実践的データセットにおいて、かなり高い予測性能を達成し、いくつかの強力なベースラインを上回ります。
- 参考スコア(独自算出の注目度): 1.7575422764391646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present KPI-BERT, a system which employs novel methods of named entity
recognition (NER) and relation extraction (RE) to extract and link key
performance indicators (KPIs), e.g. "revenue" or "interest expenses", of
companies from real-world German financial documents. Specifically, we
introduce an end-to-end trainable architecture that is based on Bidirectional
Encoder Representations from Transformers (BERT) combining a recurrent neural
network (RNN) with conditional label masking to sequentially tag entities
before it classifies their relations. Our model also introduces a learnable
RNN-based pooling mechanism and incorporates domain expert knowledge by
explicitly filtering impossible relations. We achieve a substantially higher
prediction performance on a new practical dataset of German financial reports,
outperforming several strong baselines including a competing state-of-the-art
span-based entity tagging approach.
- Abstract(参考訳): 実世界のドイツ財務文書から企業のキーパフォーマンス指標(KPI)を抽出・リンクするために、名前付きエンティティ認識(NER)と関係抽出(RE)という新しい手法を用いたKPI-BERTを提案する。
具体的には、リカレントニューラルネットワーク(RNN)と条件付きラベルマスキングを組み合わせたBERT(Bidirectional Encoder Representations from Transformers)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを導入し、それらの関係を分類する前にエンティティを逐次タグ付けする。
また、学習可能なRNNベースのプール機構を導入し、不可能な関係を明示的にフィルタリングすることでドメインエキスパートの知識を取り入れる。
我々は、ドイツの財務報告の新しい実践的データセットにおいて、非常に高い予測性能を達成し、競合する最先端のスパンベースのエンティティタギングアプローチを含む、いくつかの強力なベースラインを上回ります。
関連論文リスト
- RPN 2: On Interdependence Function Learning Towards Unifying and Advancing CNN, RNN, GNN, and Transformer [8.168523242105763]
本稿は、Reconciled Polynomial Network(RPN)に関するこれまでの研究に基づいています。
データと構造的相互依存関数を組み込むことで、RPN 2はアーキテクチャ内の新しいコンポーネント機能を介してデータ相互依存を明示的にモデル化する。
論文 参考訳(メタデータ) (2024-11-17T19:45:26Z) - Enhancing Language Models for Financial Relation Extraction with Named Entities and Part-of-Speech [5.104305392215512]
FinREタスクは、ファイナンシャルステートメント/テキストの一部が与えられたエンティティとそれらの関係を識別する。
名前付きエンティティ認識 (NER) とPart-Of-Speech (POS) を併用することで、事前学習言語モデルの性能を向上させる戦略を提案する。
金融関係データセットの実験は有望な結果を示し、既存のモデルにNERとPOSを組み込むことの利点を強調している。
論文 参考訳(メタデータ) (2024-05-02T14:33:05Z) - FinGPT: Instruction Tuning Benchmark for Open-Source Large Language
Models in Financial Datasets [9.714447724811842]
本稿では,オープンソースの大規模言語モデルに対して,インストラクションチューニングパラダイムに固有のアプローチを導入する。
私たちは、オープンソースのモデルの相互運用性に乗じて、シームレスで透過的な統合を確保します。
本稿では,エンドツーエンドのトレーニングとテストのためのベンチマーク手法を提案し,費用対効果を生かした。
論文 参考訳(メタデータ) (2023-10-07T12:52:58Z) - A Confidence-based Partial Label Learning Model for Crowd-Annotated
Named Entity Recognition [74.79785063365289]
名前付きエンティティ認識(NER)のための既存のモデルは、主に大規模ラベル付きデータセットに基づいている。
我々は,クラウドアノテートNERに対する先行信頼度(アノテータによる提案)と後続信頼度(モデルによる学習)を統合するために,信頼に基づく部分ラベル学習(CPLL)手法を提案する。
論文 参考訳(メタデータ) (2023-05-21T15:31:23Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents [1.7575422764391646]
本稿では,Electronic Data Gathering, Analysis, and Retrieval (EDGAR)システムにアップロードされた財務報告に基づいて,共同名称のエンティティ認識と関係抽出のための新しいデータセットを提案する。
主な目的は、財務文書からキーパフォーマンス指標(KPI)を抽出し、それらの数値や他の属性にリンクすることである。
単語レベルの重み付け方式を従来のF1スコアに組み込むことで,抽出プロセスの成功度を計測する手法を提案する。
論文 参考訳(メタデータ) (2022-10-17T15:06:20Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Enhancing the Generalization for Intent Classification and Out-of-Domain
Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である
近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。
本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2021-06-28T08:27:38Z) - Learning Intents behind Interactions with Knowledge Graph for
Recommendation [93.08709357435991]
知識グラフ(KG)は、推薦システムにおいてますます重要な役割を果たす。
既存のGNNベースのモデルは、きめ細かいインテントレベルでのユーザ項目関係の特定に失敗します。
本稿では,新しいモデルである知識グラフベースインテントネットワーク(kgin)を提案する。
論文 参考訳(メタデータ) (2021-02-14T03:21:36Z) - A Frustratingly Easy Approach for Entity and Relation Extraction [25.797992240847833]
本稿では,エンティティと関係抽出のための簡単なパイプライン化手法を提案する。
標準ベンチマーク(ACE04、ACE05、SciERC)における新しい最先端技術を確立する。
このアプローチは基本的に2つの独立したエンコーダ上に構築され、単にエンティティモデルを使用して関係モデルの入力を構築します。
論文 参考訳(メタデータ) (2020-10-24T07:14:01Z) - Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。
成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。
GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文 参考訳(メタデータ) (2020-03-02T15:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。