論文の概要: FinRED: A Dataset for Relation Extraction in Financial Domain
- arxiv url: http://arxiv.org/abs/2306.03736v1
- Date: Tue, 6 Jun 2023 14:52:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 14:55:42.045046
- Title: FinRED: A Dataset for Relation Extraction in Financial Domain
- Title(参考訳): FinRED:金融分野における関係抽出のためのデータセット
- Authors: Soumya Sharma, Tapas Nayak, Arusarka Bose, Ajay Kumar Meena, Koustuv
Dasgupta, Niloy Ganguly, Pawan Goyal
- Abstract要約: FinREDは金融ニュースから収集された関係抽出データセットであり、金融ドメインから関係を含むコールスクリプティングを取得する。
一般関係抽出データセットと比較してFinREDの性能は著しく低下している。
- 参考スコア(独自算出の注目度): 23.700539609170015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Relation extraction models trained on a source domain cannot be applied on a
different target domain due to the mismatch between relation sets. In the
current literature, there is no extensive open-source relation extraction
dataset specific to the finance domain. In this paper, we release FinRED, a
relation extraction dataset curated from financial news and earning call
transcripts containing relations from the finance domain. FinRED has been
created by mapping Wikidata triplets using distance supervision method. We
manually annotate the test data to ensure proper evaluation. We also experiment
with various state-of-the-art relation extraction models on this dataset to
create the benchmark. We see a significant drop in their performance on FinRED
compared to the general relation extraction datasets which tells that we need
better models for financial relation extraction.
- Abstract(参考訳): ソースドメインでトレーニングされた関係抽出モデルは、関係セット間のミスマッチのため、異なるターゲットドメインに適用できない。
現在の文献では、財務ドメインに特有の広範なオープンソース関係抽出データセットは存在しない。
本稿では、金融ニュースから収集した関係抽出データセットfinredをリリースし、金融ドメインから関係情報を含む通話記録を取得する。
FinRED は Wikidata のトリプルを遠隔監視手法を用いてマッピングすることで作成されている。
テストデータを手動でアノテートして、適切な評価を行ないます。
また、このデータセット上で様々な最先端関係抽出モデルを用いてベンチマークを作成する。
金融関係抽出のためのより良いモデルが必要であることを示す一般的な関係抽出データセットと比較して、FinREDのパフォーマンスは大幅に低下している。
関連論文リスト
- Enhancing Language Models for Financial Relation Extraction with Named Entities and Part-of-Speech [5.104305392215512]
FinREタスクは、ファイナンシャルステートメント/テキストの一部が与えられたエンティティとそれらの関係を識別する。
名前付きエンティティ認識 (NER) とPart-Of-Speech (POS) を併用することで、事前学習言語モデルの性能を向上させる戦略を提案する。
金融関係データセットの実験は有望な結果を示し、既存のモデルにNERとPOSを組み込むことの利点を強調している。
論文 参考訳(メタデータ) (2024-05-02T14:33:05Z) - Information Extraction: An application to the domain of hyper-local financial data on developing countries [0.0]
この問題に対処する2つの自然言語処理技術(NLP)を開発し評価する。
まず、発展途上国の財務テキストデータのドメインに特有のカスタムデータセットをキュレートする。
次に,変換器をベースとしたT5モデルを用いてテキストからテキストへのアプローチを探索し,NERと関係抽出を同時に行うことを目的とする。
論文 参考訳(メタデータ) (2024-03-14T03:49:36Z) - FinTree: Financial Dataset Pretrain Transformer Encoder for Relation
Extraction [0.0]
ファイナンシャルデータセット上でFinTreeを事前トレーニングし、財務タスクのモデルを適用します。
FinTreeは、従来のドメイントークンの代わりにマスク付きトークンを予測する新しい構造で際立っている。
我々の実験は、FinTreeが大規模な財務関係抽出データセットであるREFinDより優れていることを示した。
論文 参考訳(メタデータ) (2023-07-26T01:48:52Z) - GPT-FinRE: In-context Learning for Financial Relation Extraction using
Large Language Models [1.9559144041082446]
本稿では,そのようなデータセットREFinDにおける関係抽出のソリューションについて述べる。
本稿では,文脈内学習(ICL)の枠組みとしてOpenAIモデルを用いた。
総合で3位になった。最高のF1スコアは0.718だ。
論文 参考訳(メタデータ) (2023-06-30T10:12:30Z) - REFinD: Relation Extraction Financial Dataset [7.207699035400335]
提案するREFinDは,$sim$29Kのインスタンスと8種類のエンティティペア間の22のリレーションを持つ,最初の大規模アノテートされた関係データセットである。
様々な最先端ディープラーニングモデルが,数値推論,関係性,方向性のあいまいさに悩まされていることを観察した。
論文 参考訳(メタデータ) (2023-05-22T22:40:11Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - D-REX: Dialogue Relation Extraction with Explanations [65.3862263565638]
この研究は、部分的にラベル付けされたデータのみを使用しながら関係が存在することを示す説明を抽出することに焦点を当てている。
本稿では,政策誘導型半教師付きアルゴリズムD-REXを提案する。
約90%の人は、強いBERTに基づく関節関係抽出と説明モデルよりもD-REXの説明を好んでいる。
論文 参考訳(メタデータ) (2021-09-10T22:30:48Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Do We Really Need to Access the Source Data? Source Hypothesis Transfer
for Unsupervised Domain Adaptation [102.67010690592011]
Unsupervised adaptUDA (UDA) は、ラベル付きソースデータセットから学んだ知識を活用して、新しいラベル付きドメインで同様のタスクを解決することを目的としている。
従来のUDAメソッドは、モデルに適応するためには、通常、ソースデータにアクセスする必要がある。
この作業は、訓練済みのソースモデルのみが利用できる実践的な環境に取り組み、ソースデータなしでそのようなモデルを効果的に活用してUDA問題を解決する方法に取り組みます。
論文 参考訳(メタデータ) (2020-02-20T03:13:58Z) - Gaussian process imputation of multiple financial series [71.08576457371433]
金融指標、株価、為替レートなどの複数の時系列は、市場が潜んでいる状態に依存しているため、強く結びついている。
金融時系列間の関係を多出力ガウスプロセスでモデル化することで学習することに注力する。
論文 参考訳(メタデータ) (2020-02-11T19:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。