論文の概要: Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models
- arxiv url: http://arxiv.org/abs/2411.01368v1
- Date: Sat, 02 Nov 2024 21:53:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-09 19:50:55.053028
- Title: Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた株価変動予測のための財務データとニュース記事の組み合わせ
- Authors: Ali Elahi, Fatemeh Taghvaei,
- Abstract要約: 市場の動きを予測するために,Large Language Models (LLMs) を採用している。
私たちのデータセットには、さまざまなソースから収集されたニュース記事、歴史的な株価、20社の財務報告データが含まれています。
このモデルを用いて、重み付きF1スコア58.5%および59.1%のデータセットにおいて、所定の株価の変動を予測した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Predicting financial markets and stock price movements requires analyzing a company's performance, historic price movements, industry-specific events alongside the influence of human factors such as social media and press coverage. We assume that financial reports (such as income statements, balance sheets, and cash flow statements), historical price data, and recent news articles can collectively represent aforementioned factors. We combine financial data in tabular format with textual news articles and employ pre-trained Large Language Models (LLMs) to predict market movements. Recent research in LLMs has demonstrated that they are able to perform both tabular and text classification tasks, making them our primary model to classify the multi-modal data. We utilize retrieval augmentation techniques to retrieve and attach relevant chunks of news articles to financial metrics related to a company and prompt the LLMs in zero, two, and four-shot settings. Our dataset contains news articles collected from different sources, historic stock price, and financial report data for 20 companies with the highest trading volume across different industries in the stock market. We utilized recently released language models for our LLM-based classifier, including GPT- 3 and 4, and LLaMA- 2 and 3 models. We introduce an LLM-based classifier capable of performing classification tasks using combination of tabular (structured) and textual (unstructured) data. By using this model, we predicted the movement of a given stock's price in our dataset with a weighted F1-score of 58.5% and 59.1% and Matthews Correlation Coefficient of 0.175 for both 3-month and 6-month periods.
- Abstract(参考訳): 金融市場と株価の動きを予測するには、ソーシャルメディアや報道などの人的要因の影響とともに、企業の業績、歴史的価格の動き、業界固有の出来事を分析する必要がある。
我々は、財務報告(所得計算書、収支表、キャッシュフロー計算書など)、歴史的価格データ、最近のニュース記事が、上記の要因をまとめて表すことができると仮定する。
我々は、表形式での財務データをテキストニュース記事と組み合わせ、事前学習されたLarge Language Models (LLMs) を用いて市場の動きを予測する。
LLMの最近の研究は、表とテキストの両方の分類タスクを実行できることを示した。
我々は検索強化技術を用いて、関連ニュース記事の塊を企業関連財務指標に検索・添付し、ゼロ、2、4ショット設定でLSMを誘導する。
当社のデータセットには、さまざまなソースから収集されたニュース記事、歴史的な株価、および株式市場の異なる業界で最高の取引量を持つ20社の財務報告データが含まれています。
我々は最近リリースされた言語モデルを,GPT-3,4,LLaMA-2,3モデルを含むLLMベースの分類器に利用した。
表型(構造化)データとテキスト型(非構造化)データを組み合わせて分類タスクを実行できるLCMベースの分類器を提案する。
このモデルを用いて,重み付きF1スコア58.5%,59.1%,マシューズ相関係数0.175を3ヶ月と6ヶ月に設定した株の変動を予測した。
関連論文リスト
- StockTime: A Time Series Specialized Large Language Model Architecture for Stock Price Prediction [13.52020491768311]
株価時系列データに特化して設計された新しいLCMベースのアーキテクチャであるStockTimeを紹介する。
最近のFinLLMとは異なり、StockTimeは特に株価時系列データのために設計されている。
このマルチモーダルデータを融合させることで、StockTimeは任意の見返り期間の株価を効果的に予測する。
論文 参考訳(メタデータ) (2024-08-25T00:50:33Z) - NIFTY Financial News Headlines Dataset [14.622656548420073]
NIFTY Financial News Headlines データセットは,大規模言語モデル(LLM)を用いた金融市場予測の促進と進展を目的としている。
i) LLMの教師付き微調整(SFT)を目標とするNIFTY-LMと、(ii) NIFTY-RLと、(人からのフィードバックからの強化学習のような)アライメントメソッドに特化してフォーマットされたNIFTY-RLの2つの異なるモデルアプローチで構成されている。
論文 参考訳(メタデータ) (2024-05-16T01:09:33Z) - AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。
次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文 参考訳(メタデータ) (2024-03-19T09:45:33Z) - D\'olares or Dollars? Unraveling the Bilingual Prowess of Financial LLMs
Between Spanish and English [67.48541936784501]
Tois'on de Oro は、英語とのスペイン語共同で、命令データセット、微調整 LLM 、および金融 LLM の評価ベンチマークを確立する最初のフレームワークである。
7つのタスクをカバーする15のデータセットから144万以上のスペイン語と英語のサンプルを含む、厳格にキュレートされたバイリンガル命令データセットを構築した。
FLARE-ESは9つのタスクをカバーする21のデータセットを持つ最初の総合的バイリンガル評価ベンチマークである。
論文 参考訳(メタデータ) (2024-02-12T04:50:31Z) - Embrace Divergence for Richer Insights: A Multi-document Summarization Benchmark and a Case Study on Summarizing Diverse Information from News Articles [136.84278943588652]
同一イベントを含む複数のニュース記事において遭遇する多様な情報を要約する新しい課題を提案する。
この作業を容易にするために、多様な情報を特定するためのデータ収集スキーマの概要と、DiverseSummというデータセットをキュレートした。
データセットには245のニュース記事が含まれており、各ストーリーは10のニュース記事からなり、人間公認の参照と組み合わせられる。
論文 参考訳(メタデータ) (2023-09-17T20:28:17Z) - PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark
for Finance [63.51545277822702]
PIXIUは、命令データ付き微調整LLaMAに基づく最初の金融大規模言語モデル(LLM)を含む包括的なフレームワークである。
我々はLLaMAを細調整してFinMAを提案する。
我々は、FinMAと既存のLLMを詳細に分析し、重要な財政課題に対処する際の長所と短所を明らかにする。
論文 参考訳(メタデータ) (2023-06-08T14:20:29Z) - Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。
我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文 参考訳(メタデータ) (2023-04-15T19:22:37Z) - BloombergGPT: A Large Language Model for Finance [42.73350054822628]
我々は、幅広い財務データに基づいて訓練された500億のパラメータ言語モデルであるBloombergGPTを提示する。
Bloombergの広範囲なデータソースに基づいて,汎用データセットから345億のトークンを付加した,363億のトークンデータセットを構築しました。
我々の混合データセットトレーニングは、財務タスクにおける既存のモデルをかなりのマージンで上回るモデルにつながります。
論文 参考訳(メタデータ) (2023-03-30T17:30:36Z) - You can't pick your neighbors, or can you? When and how to rely on
retrieval in the $k$NN-LM [65.74934004876914]
Retrieval-enhanced Language Model (LM) は、大規模な外部データストアから取得したテキストにそれらの予測を条件付ける。
そのようなアプローチの1つ、$k$NN-LMは、既存のLMの予測を$k$-nearest近くのモデルの出力と補間する。
本研究では,2つの英語モデルデータセットに対するアプローチの有効性を実証的に測定する。
論文 参考訳(メタデータ) (2022-10-28T02:57:40Z) - Graph-Based Learning for Stock Movement Prediction with Textual and
Relational Data [0.0]
ストックフォアキャスティングのためのマルチグラフリカレントネットワーク(MGRN)という新しいストックムーブメント予測フレームワークを提案する。
このアーキテクチャは、財務ニュースからのテキストの感情と、他の財務データから抽出された複数の関係情報を組み合わせることができる。
精度テストとSTOXX Europe 600指数の株価のトレーディングシミュレーションを通じて、我々のモデルが他のベンチマークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-07-22T21:57:18Z) - Text Mining of Stocktwits Data for Predicting Stock Prices [3.3554367023486935]
FinALBERTは、株価変化に基づいてStocktwitsテキストデータをラベル付けすることで、金融分野のテキスト分類タスクを処理するように訓練されている。
私たちは主要な5つのFAANG(Facebook、Amazon、Apple、Netflix、Google)を含む25の異なる企業のために10年以上Stocktwitsデータを収集しました。
論文 参考訳(メタデータ) (2021-03-13T03:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。