論文の概要: Numerical Claim Detection in Finance: A New Financial Dataset,
Weak-Supervision Model, and Market Analysis
- arxiv url: http://arxiv.org/abs/2402.11728v1
- Date: Sun, 18 Feb 2024 22:55:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 19:19:41.077905
- Title: Numerical Claim Detection in Finance: A New Financial Dataset,
Weak-Supervision Model, and Market Analysis
- Title(参考訳): 金融における数値的クレーム検出:新しい金融データセット、弱いスーパービジョンモデル、市場分析
- Authors: Agam Shah, Arnav Hiray, Pratvi Shah, Arkaprabha Banerjee, Anushka
Singh, Dheeraj Eidnani, Bhaskar Chaudhury, Sudheer Chava
- Abstract要約: ファイナンシャルドメインにおけるクレーム検出タスクのための新たな財務データセットを構築した。
本稿では,対象物の専門家(SME)の知識を集約関数に組み込んだ,新たな弱スーパービジョンモデルを提案する。
我々は、新しい測度楽観主義を構築することによって、提案したモデルの実用性を実証する」。
- 参考スコア(独自算出の注目度): 4.9524454709622585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we investigate the influence of claims in analyst reports and
earnings calls on financial market returns, considering them as significant
quarterly events for publicly traded companies. To facilitate a comprehensive
analysis, we construct a new financial dataset for the claim detection task in
the financial domain. We benchmark various language models on this dataset and
propose a novel weak-supervision model that incorporates the knowledge of
subject matter experts (SMEs) in the aggregation function, outperforming
existing approaches. Furthermore, we demonstrate the practical utility of our
proposed model by constructing a novel measure ``optimism". Furthermore, we
observed the dependence of earnings surprise and return on our optimism
measure. Our dataset, models, and code will be made publicly (under CC BY 4.0
license) available on GitHub and Hugging Face.
- Abstract(参考訳): 本稿では、上場企業にとって重要な四半期イベントであるとして、アナリスト報告や決算報告が金融市場リターンに与える影響を検討する。
包括的分析を容易にするために,金融領域におけるクレーム検出タスクのための新たな財務データセットを構築する。
我々は,本データセット上で様々な言語モデルをベンチマークし,既存のアプローチよりも優れた対象事項エキスパート(SME)の知識を集約関数に取り入れた,新しい弱スーパービジョンモデルを提案する。
さらに,「最適化」という新しい尺度を構築することで,提案モデルの実用性を実証する。
さらに、利益サプライズへの依存と楽観的尺度への回帰も観察した。
私たちのデータセット、モデル、コードは(CC BY 4.0ライセンスの下で)GitHubとHugging Faceで公開されます。
関連論文リスト
- Large Language Model Adaptation for Financial Sentiment Analysis [2.0499240875882]
一般言語モデルは、金融に特化されたタスクでは不足する傾向にある。
1.5B未満のパラメータを持つ2つの基礎モデルは、幅広い戦略を用いて適応されている。
小型LLMは大規模モデルに匹敵する性能を有しつつ,パラメータやデータの観点からも効率がよいことを示す。
論文 参考訳(メタデータ) (2024-01-26T11:04:01Z) - Assessing Privacy Risks in Language Models: A Case Study on
Summarization Tasks [65.21536453075275]
我々は要約作業に焦点をあて、会員推測(MI)攻撃について調査する。
テキストの類似性や文書修正に対するモデルの抵抗をMI信号として活用する。
我々は、MI攻撃から保護するための要約モデルの訓練と、プライバシとユーティリティの本質的にのトレードオフについて議論する。
論文 参考訳(メタデータ) (2023-10-20T05:44:39Z) - FinGPT: Instruction Tuning Benchmark for Open-Source Large Language
Models in Financial Datasets [9.714447724811842]
本稿では,オープンソースの大規模言語モデルに対して,インストラクションチューニングパラダイムに固有のアプローチを導入する。
私たちは、オープンソースのモデルの相互運用性に乗じて、シームレスで透過的な統合を確保します。
本稿では,エンドツーエンドのトレーニングとテストのためのベンチマーク手法を提案し,費用対効果を生かした。
論文 参考訳(メタデータ) (2023-10-07T12:52:58Z) - PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark
for Finance [63.51545277822702]
PIXIUは、命令データ付き微調整LLaMAに基づく最初の金融大規模言語モデル(LLM)を含む包括的なフレームワークである。
我々はLLaMAを細調整してFinMAを提案する。
我々は、FinMAと既存のLLMを詳細に分析し、重要な財政課題に対処する際の長所と短所を明らかにする。
論文 参考訳(メタデータ) (2023-06-08T14:20:29Z) - Joint Latent Topic Discovery and Expectation Modeling for Financial
Markets [45.758436505779386]
金融市場分析のための画期的な枠組みを提示する。
このアプローチは、投資家の期待を共同でモデル化し、潜伏する株価関係を自動的に掘り下げる最初の方法だ。
私たちのモデルは年率10%を超えるリターンを継続的に達成します。
論文 参考訳(メタデータ) (2023-06-01T01:36:51Z) - KPI-EDGAR: A Novel Dataset and Accompanying Metric for Relation
Extraction from Financial Documents [1.7575422764391646]
本稿では,Electronic Data Gathering, Analysis, and Retrieval (EDGAR)システムにアップロードされた財務報告に基づいて,共同名称のエンティティ認識と関係抽出のための新しいデータセットを提案する。
主な目的は、財務文書からキーパフォーマンス指標(KPI)を抽出し、それらの数値や他の属性にリンクすることである。
単語レベルの重み付け方式を従来のF1スコアに組み込むことで,抽出プロセスの成功度を計測する手法を提案する。
論文 参考訳(メタデータ) (2022-10-17T15:06:20Z) - Discovering material information using hierarchical Reformer model on
financial regulatory filings [0.0]
金融規制書類から大規模文書レベルのデータセットであるSEDARを処理可能な階層的改革者([15])モデルを構築した。
このモデルを用いて,規制書類を用いて貿易量変化を予測可能であることを示す。
取引量の変化をうまく予測するためにモデルを微調整することは、このモデルが金融市場からの見解を捉え、規制書類の処理が有益であることを示している。
論文 参考訳(メタデータ) (2022-03-28T19:47:34Z) - FinEAS: Financial Embedding Analysis of Sentiment [0.0]
FinEAS(Financial Embedding Analysis of Sentiment)と呼ばれる新しい言語表現モデルを導入する。
本研究では,標準的なBERTモデルからの教師付き微調整文の埋め込みに基づく財務感情分析の新しいモデルを提案する。
論文 参考訳(メタデータ) (2021-10-31T15:41:56Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Gaussian process imputation of multiple financial series [71.08576457371433]
金融指標、株価、為替レートなどの複数の時系列は、市場が潜んでいる状態に依存しているため、強く結びついている。
金融時系列間の関係を多出力ガウスプロセスでモデル化することで学習することに注力する。
論文 参考訳(メタデータ) (2020-02-11T19:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。