論文の概要: KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents
- arxiv url: http://arxiv.org/abs/2210.09163v1
- Date: Mon, 17 Oct 2022 15:06:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 18:43:57.454372
- Title: KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents
- Title(参考訳): KPI-EDGAR:財務文書からの関係抽出のための新しいデータセットと対応指標
- Authors: Tobias Deu{\ss}er, Syed Musharraf Ali, Lars Hillebrand, Desiana
Nurchalifah, Basil Jacob, Christian Bauckhage, Rafet Sifa
- Abstract要約: 本稿では,Electronic Data Gathering, Analysis, and Retrieval (EDGAR)システムにアップロードされた財務報告に基づいて,共同名称のエンティティ認識と関係抽出のための新しいデータセットを提案する。
主な目的は、財務文書からキーパフォーマンス指標(KPI)を抽出し、それらの数値や他の属性にリンクすることである。
単語レベルの重み付け方式を従来のF1スコアに組み込むことで,抽出プロセスの成功度を計測する手法を提案する。
- 参考スコア(独自算出の注目度): 1.7575422764391646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce KPI-EDGAR, a novel dataset for Joint Named Entity Recognition
and Relation Extraction building on financial reports uploaded to the
Electronic Data Gathering, Analysis, and Retrieval (EDGAR) system, where the
main objective is to extract Key Performance Indicators (KPIs) from financial
documents and link them to their numerical values and other attributes. We
further provide four accompanying baselines for benchmarking potential future
research. Additionally, we propose a new way of measuring the success of said
extraction process by incorporating a word-level weighting scheme into the
conventional F1 score to better model the inherently fuzzy borders of the
entity pairs of a relation in this domain.
- Abstract(参考訳): 我々は,電子データ収集・分析・検索システム(EDGAR)にアップロードされた財務報告に基づいて,共同名称のエンティティ認識・関係抽出構築のための新しいデータセットであるKPI-EDGARを紹介し,その主な目的は,財務文書からキーパフォーマンス指標(KPI)を抽出し,それらの数値や他の属性にリンクすることである。
さらに、今後の研究をベンチマークするための4つのベースラインも提供します。
さらに、従来のf1スコアに単語レベルの重み付けスキームを組み込むことにより、この領域における関係のエンティティ対の固有ファジィ境界をより良くモデル化し、抽出プロセスの成功を測定する新しい方法を提案する。
関連論文リスト
- Top-K Pairwise Ranking: Bridging the Gap Among Ranking-Based Measures for Multi-Label Classification [120.37051160567277]
本稿では,Top-K Pairwise Ranking(TKPR)という新しい尺度を提案する。
一連の分析により、TKPRは既存のランキングベースの尺度と互換性があることが示されている。
一方,データ依存縮約法という新しい手法に基づいて,提案手法の急激な一般化を確立する。
論文 参考訳(メタデータ) (2024-07-09T09:36:37Z) - Numerical Claim Detection in Finance: A New Financial Dataset, Weak-Supervision Model, and Market Analysis [4.575870619860645]
ファイナンシャルドメインにおけるクレーム検出タスクのための新たな財務データセットを構築した。
本稿では,対象物の専門家(SME)の知識を集約関数に組み込んだ,新たな弱スーパービジョンモデルを提案する。
ここでは、利益の急落と楽観的な指標への回帰の依存を観察する。
論文 参考訳(メタデータ) (2024-02-18T22:55:26Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - GPT-FinRE: In-context Learning for Financial Relation Extraction using
Large Language Models [1.9559144041082446]
本稿では,そのようなデータセットREFinDにおける関係抽出のソリューションについて述べる。
本稿では,文脈内学習(ICL)の枠組みとしてOpenAIモデルを用いた。
総合で3位になった。最高のF1スコアは0.718だ。
論文 参考訳(メタデータ) (2023-06-30T10:12:30Z) - FinRED: A Dataset for Relation Extraction in Financial Domain [23.700539609170015]
FinREDは金融ニュースから収集された関係抽出データセットであり、金融ドメインから関係を含むコールスクリプティングを取得する。
一般関係抽出データセットと比較してFinREDの性能は著しく低下している。
論文 参考訳(メタデータ) (2023-06-06T14:52:47Z) - Exogenous Data in Forecasting: FARM -- A New Measure for Relevance
Evaluation [62.997667081978825]
FARM - Forward Relevance Aligned Metricという新しいアプローチを導入する。
我々のフォワード法は、その後のデータポイントの変化を時系列に合わせるために比較する角測度に依存する。
第1の検証ステップとして、FARMアプローチの合成信号・代表信号への適用について述べる。
論文 参考訳(メタデータ) (2023-04-21T15:22:33Z) - KPI-BERT: A Joint Named Entity Recognition and Relation Extraction Model
for Financial Reports [1.7575422764391646]
変換器からの双方向表現(BERT)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを提案する。
BERTは、リカレントニューラルネットワーク(RNN)と条件付きラベルマスクを組み合わせることで、関係を分類する前にエンティティをシーケンシャルにタグ付けする。
我々は、ドイツ財務報告の新しい実践的データセットにおいて、かなり高い予測性能を達成し、いくつかの強力なベースラインを上回ります。
論文 参考訳(メタデータ) (2022-08-03T15:21:28Z) - Federated Learning Aggregation: New Robust Algorithms with Guarantees [63.96013144017572]
エッジでの分散モデルトレーニングのために、フェデレートラーニングが最近提案されている。
本稿では,連合学習フレームワークにおける集約戦略を評価するために,完全な数学的収束解析を提案する。
損失の値に応じてクライアントのコントリビューションを差別化することで、モデルアーキテクチャを変更できる新しい集約アルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-05-22T16:37:53Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Bandit Data-Driven Optimization [62.01362535014316]
機械学習パイプラインが設定で有用になるためには、克服しなければならない大きな問題点が4つある。
これらの問題点に対処する最初の反復予測記述フレームワークであるBanditデータ駆動最適化を導入する。
本稿では,このフレームワークの新しいアルゴリズム PROOF を提案する。
論文 参考訳(メタデータ) (2020-08-26T17:50:49Z) - Reasoning with Latent Structure Refinement for Document-Level Relation
Extraction [20.308845516900426]
本稿では,潜在文書レベルグラフを自動的に誘導することにより,文間の関係推論を促進する新しいモデルを提案する。
具体的には、大規模文書レベルデータセット(DocRED)上でF1スコア59.05を達成する。
論文 参考訳(メタデータ) (2020-05-13T13:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。