論文の概要: Trillion Dollar Words: A New Financial Dataset, Task & Market Analysis
- arxiv url: http://arxiv.org/abs/2305.07972v1
- Date: Sat, 13 May 2023 17:32:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 18:31:44.301863
- Title: Trillion Dollar Words: A New Financial Dataset, Task & Market Analysis
- Title(参考訳): Trillion Dollar Words: 新たな金融データセットとタスク&マーケット分析
- Authors: Agam Shah and Suvan Paturi and Sudheer Chava
- Abstract要約: 我々は、FOMC(Federal Open Market Committee)のスピーチ、会議の議事録、記者会見の書き起こしの最大のトークン化および注釈付きデータセットを構築した。
最高の業績モデル(RoBERTa-large)を用いて、文書公開日の金融政策スタンスを測る。
私たちのデータセット、モデル、コードは、CC BY-NC 4.0ライセンスの下でHuggingfaceとGitHubで公開されています。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Monetary policy pronouncements by Federal Open Market Committee (FOMC) are a
major driver of financial market returns. We construct the largest tokenized
and annotated dataset of FOMC speeches, meeting minutes, and press conference
transcripts in order to understand how monetary policy influences financial
markets. In this study, we develop a novel task of hawkish-dovish
classification and benchmark various pre-trained language models on the
proposed dataset. Using the best-performing model (RoBERTa-large), we construct
a measure of monetary policy stance for the FOMC document release days. To
evaluate the constructed measure, we study its impact on the treasury market,
stock market, and macroeconomic indicators. Our dataset, models, and code are
publicly available on Huggingface and GitHub under CC BY-NC 4.0 license.
- Abstract(参考訳): 連邦公開市場委員会(FOMC)による金融政策宣言は、金融市場リターンの主要な要因である。
我々は、金融政策が金融市場に与える影響を理解するために、fomcスピーチ、会議分、記者会見の書き起こしの最大のトークン化および注釈付きデータセットを構築します。
本研究では,ホーカッシュ・ドヴィッシュ分類の新たなタスクを開発し,提案するデータセット上での各種事前学習言語モデルのベンチマークを行った。
最良業績モデル(RoBERTa-large)を用いて,FOMC文書公開日に対する金融政策スタンスを測定する。
構築した指標を評価するため,金融市場,株式市場,マクロ経済指標への影響について検討する。
私たちのデータセット、モデル、コードはcc by-nc 4.0ライセンスの下でhughingfaceとgithubで公開されている。
関連論文リスト
- FMPAF: How Do Fed Chairs Affect the Financial Market? A Fine-grained
Monetary Policy Analysis Framework on Their Language [3.760301720305374]
大規模言語モデル(LLM)と回帰分析を統合する新しいアプローチであるFMPAF(Fincent-Grained Monetary Policy Analysis Framework)を提案する。
当社の望ましい仕様に基づき、S&P 500 Exchange-Traded Fundの価格上昇に伴うセンチメントスコアのワンユニット上昇が関係している。
論文 参考訳(メタデータ) (2024-03-10T07:21:31Z) - Numerical Claim Detection in Finance: A New Financial Dataset,
Weak-Supervision Model, and Market Analysis [4.9524454709622585]
ファイナンシャルドメインにおけるクレーム検出タスクのための新たな財務データセットを構築した。
本稿では,対象物の専門家(SME)の知識を集約関数に組み込んだ,新たな弱スーパービジョンモデルを提案する。
我々は、新しい測度楽観主義を構築することによって、提案したモデルの実用性を実証する」。
論文 参考訳(メタデータ) (2024-02-18T22:55:26Z) - CSPRD: A Financial Policy Retrieval Dataset for Chinese Stock Market [61.59326951366202]
我々は、中国株式政策検索データセット(CSPRD)を導入して、新たな課題である政策検索を提案する。
CSPRDは、中国の政策コーパスの10k以上の項目から、経験豊富な専門家によってラベル付けされた700以上のパスを提供する。
我々の最高のパフォーマンスベースラインは56.1% MRR@10、28.5% NDCG@10、37.5% Recall@10、80.6% Precision@10である。
論文 参考訳(メタデータ) (2023-09-08T15:40:54Z) - PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark
for Finance [63.51545277822702]
PIXIUは、命令データ付き微調整LLaMAに基づく最初の金融大規模言語モデル(LLM)を含む包括的なフレームワークである。
我々はLLaMAを細調整してFinMAを提案する。
我々は、FinMAと既存のLLMを詳細に分析し、重要な財政課題に対処する際の長所と短所を明らかにする。
論文 参考訳(メタデータ) (2023-06-08T14:20:29Z) - Analysis of the Fed's communication by using textual entailment model of
Zero-Shot classification [0.0]
我々は、テキストマイニング技術を用いて中央銀行が発行した文書を分析した。
声明のトーン、議事録、記者会見の書き起こし、米連邦準備制度理事会(FRB)の演説を比較します。
論文 参考訳(メタデータ) (2023-06-07T09:23:26Z) - Dynamic Datasets and Market Environments for Financial Reinforcement
Learning [68.11692837240756]
FinRL-Metaは、現実世界の市場からジムスタイルの市場環境へ動的データセットを処理するライブラリである。
我々は,ユーザが新しい取引戦略を設計するための足場として,人気のある研究論文を例示し,再現する。
また、ユーザが自身の結果を視覚化し、相対的なパフォーマンスを評価するために、このライブラリをクラウドプラットフォームにデプロイします。
論文 参考訳(メタデータ) (2023-04-25T22:17:31Z) - BloombergGPT: A Large Language Model for Finance [42.73350054822628]
我々は、幅広い財務データに基づいて訓練された500億のパラメータ言語モデルであるBloombergGPTを提示する。
Bloombergの広範囲なデータソースに基づいて,汎用データセットから345億のトークンを付加した,363億のトークンデータセットを構築しました。
我々の混合データセットトレーニングは、財務タスクにおける既存のモデルをかなりのマージンで上回るモデルにつながります。
論文 参考訳(メタデータ) (2023-03-30T17:30:36Z) - Tracking Turbulence Through Financial News During COVID-19 [12.031113181911627]
我々は、2020年のパンデミックの米国金融崩壊における金融出版物の感情に関する関係を明らかにし、議論する。
まず、アメリカの大手金融ニュース出版社の記事に対して、金融感情に関する専門的な注釈をいくつか紹介する。
探索的なデータ分析の後、金融感情を予測するタスクに対処するCNNベースのアーキテクチャについて述べる。
論文 参考訳(メタデータ) (2021-09-09T15:55:32Z) - Gaussian process imputation of multiple financial series [71.08576457371433]
金融指標、株価、為替レートなどの複数の時系列は、市場が潜んでいる状態に依存しているため、強く結びついている。
金融時系列間の関係を多出力ガウスプロセスでモデル化することで学習することに注力する。
論文 参考訳(メタデータ) (2020-02-11T19:18:18Z) - Reinforcement-Learning based Portfolio Management with Augmented Asset
Movement Prediction States [71.54651874063865]
ポートフォリオマネジメント(PM)は、最大利益や最小リスクといった投資目標を達成することを目的としている。
本稿では,PMのための新しいステート拡張RLフレームワークであるSARLを提案する。
当社の枠組みは, 金融PMにおける2つのユニークな課題に対処することを目的としている。(1) データの異種データ -- 資産毎の収集情報は通常, 多様性, ノイズ, 不均衡(ニュース記事など), (2) 環境の不確実性 -- 金融市場は多様で非定常である。
論文 参考訳(メタデータ) (2020-02-09T08:10:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。