論文の概要: KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents
- arxiv url: http://arxiv.org/abs/2210.09163v1
- Date: Mon, 17 Oct 2022 15:06:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 18:43:57.454372
- Title: KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents
- Title(参考訳): KPI-EDGAR:財務文書からの関係抽出のための新しいデータセットと対応指標
- Authors: Tobias Deu{\ss}er, Syed Musharraf Ali, Lars Hillebrand, Desiana
Nurchalifah, Basil Jacob, Christian Bauckhage, Rafet Sifa
- Abstract要約: 本稿では,Electronic Data Gathering, Analysis, and Retrieval (EDGAR)システムにアップロードされた財務報告に基づいて,共同名称のエンティティ認識と関係抽出のための新しいデータセットを提案する。
主な目的は、財務文書からキーパフォーマンス指標(KPI)を抽出し、それらの数値や他の属性にリンクすることである。
単語レベルの重み付け方式を従来のF1スコアに組み込むことで,抽出プロセスの成功度を計測する手法を提案する。
- 参考スコア(独自算出の注目度): 1.7575422764391646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce KPI-EDGAR, a novel dataset for Joint Named Entity Recognition
and Relation Extraction building on financial reports uploaded to the
Electronic Data Gathering, Analysis, and Retrieval (EDGAR) system, where the
main objective is to extract Key Performance Indicators (KPIs) from financial
documents and link them to their numerical values and other attributes. We
further provide four accompanying baselines for benchmarking potential future
research. Additionally, we propose a new way of measuring the success of said
extraction process by incorporating a word-level weighting scheme into the
conventional F1 score to better model the inherently fuzzy borders of the
entity pairs of a relation in this domain.
- Abstract(参考訳): 我々は,電子データ収集・分析・検索システム(EDGAR)にアップロードされた財務報告に基づいて,共同名称のエンティティ認識・関係抽出構築のための新しいデータセットであるKPI-EDGARを紹介し,その主な目的は,財務文書からキーパフォーマンス指標(KPI)を抽出し,それらの数値や他の属性にリンクすることである。
さらに、今後の研究をベンチマークするための4つのベースラインも提供します。
さらに、従来のf1スコアに単語レベルの重み付けスキームを組み込むことにより、この領域における関係のエンティティ対の固有ファジィ境界をより良くモデル化し、抽出プロセスの成功を測定する新しい方法を提案する。
関連論文リスト
- Numerical Claim Detection in Finance: A New Financial Dataset,
Weak-Supervision Model, and Market Analysis [4.9524454709622585]
ファイナンシャルドメインにおけるクレーム検出タスクのための新たな財務データセットを構築した。
本稿では,対象物の専門家(SME)の知識を集約関数に組み込んだ,新たな弱スーパービジョンモデルを提案する。
我々は、新しい測度楽観主義を構築することによって、提案したモデルの実用性を実証する」。
論文 参考訳(メタデータ) (2024-02-18T22:55:26Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - GPT-FinRE: In-context Learning for Financial Relation Extraction using
Large Language Models [1.9559144041082446]
本稿では,そのようなデータセットREFinDにおける関係抽出のソリューションについて述べる。
本稿では,文脈内学習(ICL)の枠組みとしてOpenAIモデルを用いた。
総合で3位になった。最高のF1スコアは0.718だ。
論文 参考訳(メタデータ) (2023-06-30T10:12:30Z) - FinRED: A Dataset for Relation Extraction in Financial Domain [23.700539609170015]
FinREDは金融ニュースから収集された関係抽出データセットであり、金融ドメインから関係を含むコールスクリプティングを取得する。
一般関係抽出データセットと比較してFinREDの性能は著しく低下している。
論文 参考訳(メタデータ) (2023-06-06T14:52:47Z) - Enabling and Analyzing How to Efficiently Extract Information from
Hybrid Long Documents with LLMs [48.87627426640621]
本研究は,財務報告から重要な情報を理解するために,大規模言語モデルの可能性を活用することに焦点を当てる。
財務報告から情報を理解し抽出するLLMの能力を高める自動財務情報抽出フレームワークを提案する。
本フレームワークは, GPT-3.5とGPT-4で有効に検証され, 平均精度は53.94%, 33.77%向上した。
論文 参考訳(メタデータ) (2023-05-24T10:35:58Z) - Exogenous Data in Forecasting: FARM -- A New Measure for Relevance
Evaluation [62.997667081978825]
FARM - Forward Relevance Aligned Metricという新しいアプローチを導入する。
我々のフォワード法は、その後のデータポイントの変化を時系列に合わせるために比較する角測度に依存する。
第1の検証ステップとして、FARMアプローチの合成信号・代表信号への適用について述べる。
論文 参考訳(メタデータ) (2023-04-21T15:22:33Z) - KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports [1.7575422764391646]
変換器からの双方向表現(BERT)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを提案する。
BERTは、リカレントニューラルネットワーク(RNN)と条件付きラベルマスクを組み合わせることで、関係を分類する前にエンティティをシーケンシャルにタグ付けする。
我々は、ドイツ財務報告の新しい実践的データセットにおいて、かなり高い予測性能を達成し、いくつかの強力なベースラインを上回ります。
論文 参考訳(メタデータ) (2022-08-03T15:21:28Z) - Federated Learning Aggregation: New Robust Algorithms with Guarantees [63.96013144017572]
エッジでの分散モデルトレーニングのために、フェデレートラーニングが最近提案されている。
本稿では,連合学習フレームワークにおける集約戦略を評価するために,完全な数学的収束解析を提案する。
損失の値に応じてクライアントのコントリビューションを差別化することで、モデルアーキテクチャを変更できる新しい集約アルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-05-22T16:37:53Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Bandit Data-Driven Optimization [62.01362535014316]
機械学習パイプラインが設定で有用になるためには、克服しなければならない大きな問題点が4つある。
これらの問題点に対処する最初の反復予測記述フレームワークであるBanditデータ駆動最適化を導入する。
本稿では,このフレームワークの新しいアルゴリズム PROOF を提案する。
論文 参考訳(メタデータ) (2020-08-26T17:50:49Z) - Reasoning with Latent Structure Refinement for Document-Level Relation
Extraction [20.308845516900426]
本稿では,潜在文書レベルグラフを自動的に誘導することにより,文間の関係推論を促進する新しいモデルを提案する。
具体的には、大規模文書レベルデータセット(DocRED)上でF1スコア59.05を達成する。
論文 参考訳(メタデータ) (2020-05-13T13:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。