論文の概要: KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports
- arxiv url: http://arxiv.org/abs/2208.02140v1
- Date: Wed, 3 Aug 2022 15:21:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 13:04:27.592325
- Title: KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports
- Title(参考訳): kpi-bert: 財務報告のためのエンティティ認識と関係抽出モデル
- Authors: Lars Hillebrand, Tobias Deu{\ss}er, Tim Dilmaghani, Bernd Kliem,
R\"udiger Loitz, Christian Bauckhage, Rafet Sifa
- Abstract要約: 変換器からの双方向表現(BERT)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを提案する。
BERTは、リカレントニューラルネットワーク(RNN)と条件付きラベルマスクを組み合わせることで、関係を分類する前にエンティティをシーケンシャルにタグ付けする。
我々は、ドイツ財務報告の新しい実践的データセットにおいて、かなり高い予測性能を達成し、いくつかの強力なベースラインを上回ります。
- 参考スコア(独自算出の注目度): 1.7575422764391646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present KPI-BERT, a system which employs novel methods of named entity
recognition (NER) and relation extraction (RE) to extract and link key
performance indicators (KPIs), e.g. "revenue" or "interest expenses", of
companies from real-world German financial documents. Specifically, we
introduce an end-to-end trainable architecture that is based on Bidirectional
Encoder Representations from Transformers (BERT) combining a recurrent neural
network (RNN) with conditional label masking to sequentially tag entities
before it classifies their relations. Our model also introduces a learnable
RNN-based pooling mechanism and incorporates domain expert knowledge by
explicitly filtering impossible relations. We achieve a substantially higher
prediction performance on a new practical dataset of German financial reports,
outperforming several strong baselines including a competing state-of-the-art
span-based entity tagging approach.
- Abstract(参考訳): 実世界のドイツ財務文書から企業のキーパフォーマンス指標(KPI)を抽出・リンクするために、名前付きエンティティ認識(NER)と関係抽出(RE)という新しい手法を用いたKPI-BERTを提案する。
具体的には、リカレントニューラルネットワーク(RNN)と条件付きラベルマスキングを組み合わせたBERT(Bidirectional Encoder Representations from Transformers)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを導入し、それらの関係を分類する前にエンティティを逐次タグ付けする。
また、学習可能なRNNベースのプール機構を導入し、不可能な関係を明示的にフィルタリングすることでドメインエキスパートの知識を取り入れる。
我々は、ドイツの財務報告の新しい実践的データセットにおいて、非常に高い予測性能を達成し、競合する最先端のスパンベースのエンティティタギングアプローチを含む、いくつかの強力なベースラインを上回ります。
関連論文リスト
- RelGNN: Composite Message Passing for Relational Deep Learning [56.48834369525997]
本稿では,リレーショナルデータベースの特徴を捉えた新しいGNNフレームワークであるRelGNNを紹介する。
我々のアプローチの核となるのは、高次三部構造を形成するノードの列である原子経路の導入である。
RelGNNは、最先端の精度を最大25%改善して一貫して達成している。
論文 参考訳(メタデータ) (2025-02-10T18:58:40Z) - Dynamic Feature Fusion: Combining Global Graph Structures and Local Semantics for Blockchain Fraud Detection [0.7510165488300369]
本稿では,グラフに基づく表現学習と意味的特徴抽出を組み合わせた動的特徴融合モデルを提案する。
我々は,グラフ構築,時間的特徴強調,テキスト前処理を含む包括的データ処理パイプラインを開発する。
大規模な実世界のブロックチェーンデータセットの実験結果は、我々の手法が既存のベンチマークを精度、F1スコア、リコールメトリクスで上回っていることを示している。
論文 参考訳(メタデータ) (2025-01-03T09:04:43Z) - Exact Certification of (Graph) Neural Networks Against Label Poisoning [50.87615167799367]
機械学習モデルはラベルのフリップ(ラベルのフリップ)に弱い。
サンプルと集合証明書の両方を抽出し,正確な認証手法を提案する。
私たちの研究は、ニューラルネットワークによって引き起こされた毒殺攻撃に対する最初の正確な証明書を提示しました。
論文 参考訳(メタデータ) (2024-11-30T17:05:12Z) - Enhancing Language Models for Financial Relation Extraction with Named Entities and Part-of-Speech [5.104305392215512]
FinREタスクは、ファイナンシャルステートメント/テキストの一部が与えられたエンティティとそれらの関係を識別する。
名前付きエンティティ認識 (NER) とPart-Of-Speech (POS) を併用することで、事前学習言語モデルの性能を向上させる戦略を提案する。
金融関係データセットの実験は有望な結果を示し、既存のモデルにNERとPOSを組み込むことの利点を強調している。
論文 参考訳(メタデータ) (2024-05-02T14:33:05Z) - FinGPT: Instruction Tuning Benchmark for Open-Source Large Language
Models in Financial Datasets [9.714447724811842]
本稿では,オープンソースの大規模言語モデルに対して,インストラクションチューニングパラダイムに固有のアプローチを導入する。
私たちは、オープンソースのモデルの相互運用性に乗じて、シームレスで透過的な統合を確保します。
本稿では,エンドツーエンドのトレーニングとテストのためのベンチマーク手法を提案し,費用対効果を生かした。
論文 参考訳(メタデータ) (2023-10-07T12:52:58Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents [1.7575422764391646]
本稿では,Electronic Data Gathering, Analysis, and Retrieval (EDGAR)システムにアップロードされた財務報告に基づいて,共同名称のエンティティ認識と関係抽出のための新しいデータセットを提案する。
主な目的は、財務文書からキーパフォーマンス指標(KPI)を抽出し、それらの数値や他の属性にリンクすることである。
単語レベルの重み付け方式を従来のF1スコアに組み込むことで,抽出プロセスの成功度を計測する手法を提案する。
論文 参考訳(メタデータ) (2022-10-17T15:06:20Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Learning Intents behind Interactions with Knowledge Graph for
Recommendation [93.08709357435991]
知識グラフ(KG)は、推薦システムにおいてますます重要な役割を果たす。
既存のGNNベースのモデルは、きめ細かいインテントレベルでのユーザ項目関係の特定に失敗します。
本稿では,新しいモデルである知識グラフベースインテントネットワーク(kgin)を提案する。
論文 参考訳(メタデータ) (2021-02-14T03:21:36Z) - Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。
成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。
GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文 参考訳(メタデータ) (2020-03-02T15:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。