論文の概要: Retrieval-augmented Large Language Models for Financial Time Series Forecasting
- arxiv url: http://arxiv.org/abs/2502.05878v3
- Date: Sat, 07 Jun 2025 00:43:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 21:10:46.87327
- Title: Retrieval-augmented Large Language Models for Financial Time Series Forecasting
- Title(参考訳): 財務時系列予測のための検索型大規模言語モデル
- Authors: Mengxi Xiao, Zihao Jiang, Lingfei Qian, Zhengyu Chen, Yueru He, Yijing Xu, Yuecheng Jiang, Dong Li, Ruey-Ling Weng, Min Peng, Jimin Huang, Sophia Ananiadou, Qianqian Xie,
- Abstract要約: 我々は、金融時系列予測のための新しいドメイン固有検索器FinSeerを備えた、最初の検索拡張世代(RAG)フレームワークであるFinSragを紹介する。
FinSeer は LLM フィードバックによって改良された候補選択機構と類似性駆動型トレーニング目標を活用し、財務ノイズを除去しながらクエリを歴史的に影響力のあるシーケンスと整合させる。
我々は、より広範な金融指標を統合する新しいデータセットをキュレートすることで、検索コーパスを強化し、これまで見過ごされていた市場のダイナミクスを捉えます。
- 参考スコア(独自算出の注目度): 29.769616823587594
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately forecasting stock price movements is critical for informed financial decision-making, supporting applications ranging from algorithmic trading to risk management. However, this task remains challenging due to the difficulty of retrieving subtle yet high-impact patterns from noisy financial time-series data, where conventional retrieval methods, whether based on generic language models or simplistic numeric similarity, often fail to capture the intricate temporal dependencies and context-specific signals essential for precise market prediction. To bridge this gap, we introduce FinSrag, the first retrieval-augmented generation (RAG) framework with a novel domain-specific retriever FinSeer for financial time-series forecasting. FinSeer leverages a candidate selection mechanism refined by LLM feedback and a similarity-driven training objective to align queries with historically influential sequences while filtering out financial noise. Such training enables FinSeer to identify the most relevant time-series data segments for downstream forecasting tasks, unlike embedding or distance-based retrieval methods used in existing RAG frameworks. The retrieved patterns are then fed into StockLLM, a 1B-parameter LLM fine-tuned for stock movement prediction, which serves as the generative backbone. Beyond the retrieval method, we enrich the retrieval corpus by curating new datasets that integrate a broader set of financial indicators, capturing previously overlooked market dynamics. Experiments demonstrate that FinSeer outperforms existing textual retrievers and traditional distance-based retrieval approaches in enhancing the prediction accuracy of StockLLM, underscoring the importance of domain-specific retrieval frameworks in handling the complexity of financial time-series data.
- Abstract(参考訳): 株価の動きを正確に予測することは、アルゴリズムトレーディングからリスク管理まで幅広いアプリケーションをサポートする、情報的な金融決定に不可欠である。
しかし、一般的な言語モデルや単純化された数値的類似性に基づく従来の検索手法が、正確な市場予測に不可欠な複雑な時間的依存関係やコンテキスト固有の信号の取得に失敗した場合、ノイズの多い金融時系列データから微妙で高インパクトなパターンを抽出することが困難であることから、この課題は依然として困難なままである。
このギャップを埋めるために、ファイナンシャル時系列予測のための新しいドメイン固有検索器FinSeerを備えた、最初の検索拡張世代(RAG)フレームワークであるFinSragを紹介する。
FinSeer は LLM フィードバックによって改良された候補選択機構と類似性駆動型トレーニング目標を活用し、財務ノイズを除去しながらクエリを歴史的に影響力のあるシーケンスと整合させる。
このようなトレーニングにより、既存のRAGフレームワークで使用されている埋め込みや距離ベースの検索方法とは異なり、FinSeerは下流の予測タスクにおいて最も関連性の高い時系列データセグメントを特定できる。
得られたパターンは、生成バックボーンとして機能するストックムーブメント予測のために微調整された1BパラメータLDMであるStockLLMに入力される。
検索法以外にも、より広範な財務指標を統合した新しいデータセットをキュレーションし、これまで見過ごされていた市場動態を捉えることにより、検索コーパスを充実させる。
実験により、FinSeerは既存のテキスト検索手法や従来の遠隔検索手法よりも、StockLLMの予測精度の向上に優れており、金融時系列データの複雑さを扱う上で、ドメイン固有の検索フレームワークの重要性が強調されている。
関連論文リスト
- FinDER: Financial Dataset for Question Answering and Evaluating Retrieval-Augmented Generation [63.55583665003167]
ファイナンスにおけるRetrieval-Augmented Generation(RAG)に適したエキスパート生成データセットであるFinDERを提案する。
FinDERは、ドメインの専門家による検索関連証拠の注釈付けに重点を置いており、5,703のクエリ・エビデンス・アンサー・トリプルを提供している。
大きなコーパスから関連する情報を取得するためにモデルに挑戦することで、FinDERはRAGシステムを評価するためのより現実的なベンチマークを提供する。
論文 参考訳(メタデータ) (2025-04-22T11:30:13Z) - An Advanced Ensemble Deep Learning Framework for Stock Price Prediction Using VAE, Transformer, and LSTM Model [4.097563258332958]
本研究では,3つの先進ニューラルネットワークアーキテクチャを組み合わせることで,株価予測のための最先端の深層学習フレームワークを提案する。
このフレームワークは豊富な技術的指標を使用し、現在の市場状況に基づいて予測器をスケールする。
金融専門家や学者にとって、アルゴリズム取引、リスク分析、制御と意思決定に非常に重要な応用がある。
論文 参考訳(メタデータ) (2025-03-28T07:20:40Z) - Exploring Training and Inference Scaling Laws in Generative Retrieval [50.82554729023865]
モデルサイズ,トレーニングデータスケール,推論時間計算が生成的検索性能にどのように影響するかを検討する。
実験の結果,n-gram-based method はトレーニング法と推論法の両方と強く一致していることがわかった。
LLaMAモデルはT5モデルより一貫して優れており、生成検索におけるデコーダのみの大きなモデルに対して特に有利であることが示唆された。
論文 参考訳(メタデータ) (2025-03-24T17:59:03Z) - Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems [5.712288463584192]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚を緩和するための有望なフレームワークとして登場した。
本研究では,財務文書の検索を効率化する,効率的なエンドツーエンドRAGパイプラインを提案する。
論文 参考訳(メタデータ) (2025-03-19T13:21:49Z) - ZiGong 1.0: A Large Language Model for Financial Credit [8.49779245416985]
大規模言語モデル (LLM) は様々な自然言語処理 (NLP) タスクにおいて高い性能を示している。
しかし、金融信用評価の応用における効果は、依然として準最適である。
マルチタスク制御による微調整により強化されたMistralベースのモデルであるZiGongを提案する。
論文 参考訳(メタデータ) (2025-02-22T09:27:56Z) - Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - Multi-Reranker: Maximizing performance of retrieval-augmented generation in the FinanceRAG challenge [5.279257531335345]
本稿では,ACM-ICAIF '24 FinanceRAGコンペティションのための,高性能で財務特化度の高いRetrieval-Augmented Generation(RAG)システムの開発について述べる。
我々は,検索前段階におけるクエリ拡張とコーパスの洗練に関するアブレーション研究を通じて,性能を最適化した。
特に,生成フェーズの長いコンテキストサイズを管理するための効率的な手法を導入し,性能を犠牲にすることなく応答品質を大幅に改善した。
論文 参考訳(メタデータ) (2024-11-23T09:56:21Z) - BreakGPT: Leveraging Large Language Models for Predicting Asset Price Surges [55.2480439325792]
本稿では,時系列予測や資産価格の急上昇の予測に特化して,新たな大規模言語モデル(LLM)アーキテクチャであるBreakGPTを紹介する。
我々は、最小限のトレーニングで財務予測を行うための有望なソリューションとしてBreakGPTを紹介し、局所的およびグローバルな時間的依存関係をキャプチャする強力な競合相手として紹介する。
論文 参考訳(メタデータ) (2024-11-09T05:40:32Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.38604803625294]
IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。
我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。
不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-03T17:39:38Z) - StockTime: A Time Series Specialized Large Language Model Architecture for Stock Price Prediction [13.52020491768311]
株価時系列データに特化して設計された新しいLCMベースのアーキテクチャであるStockTimeを紹介する。
最近のFinLLMとは異なり、StockTimeは特に株価時系列データのために設計されている。
このマルチモーダルデータを融合させることで、StockTimeは任意の見返り期間の株価を効果的に予測する。
論文 参考訳(メタデータ) (2024-08-25T00:50:33Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。
次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文 参考訳(メタデータ) (2024-03-19T09:45:33Z) - Sentiment-driven prediction of financial returns: a Bayesian-enhanced
FinBERT approach [1.131316248570352]
本研究では、FinBERT大言語モデルを用いて、ツイートから抽出した感情情報を活用する効果を示す。
この成功は、バックテストトレーディング中に明らかに高い累積利益をもたらす。
論文 参考訳(メタデータ) (2024-03-07T11:56:36Z) - FinPT: Financial Risk Prediction with Profile Tuning on Pretrained
Foundation Models [32.7825479037623]
FinPTは、金融リスク予測のための新しいアプローチであり、大規模な事前訓練された基礎モデルに基づいてプロファイルチューニングを行う。
FinBenchは、デフォルト、詐欺、チャーンといった金融リスクに関する高品質なデータセットのセットである。
論文 参考訳(メタデータ) (2023-07-22T09:27:05Z) - Feature Selection with Annealing for Forecasting Financial Time Series [2.44755919161855]
本研究では,機械学習(ML)モデルを用いた戦術的入力出力特徴マッピング技術に基づいて,財務時系列を総合的に予測する手法を提案する。
実験の結果,FSAアルゴリズムは問題の種類に関わらず,MLモデルの性能を向上することが示された。
論文 参考訳(メタデータ) (2023-03-03T21:33:38Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Price graphs: Utilizing the structural information of financial time
series for stock prediction [4.4707451544733905]
株価予測に関する両問題に対処する新しい枠組みを提案する。
時系列を複雑なネットワークに変換するという点では、市場価格をグラフに変換する。
予測モデル入力として時間点間の関係を表すためにグラフ埋め込みを用いる。
論文 参考訳(メタデータ) (2021-06-04T14:46:08Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。