論文の概要: VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis
- arxiv url: http://arxiv.org/abs/2505.18570v1
- Date: Sat, 24 May 2025 07:20:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.513224
- Title: VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis
- Title(参考訳): VISTA:無トレーニングストック時系列分析のためのビジョンランゲージ推論
- Authors: Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Portaghloo,
- Abstract要約: VISTA(Vision-Language Inference for Stock Time-Series Analysis)は,マルチモーダルストック予測のためのトレーニングフリーフレームワークである。
我々は、標準ベースラインに対してVISTAをベンチマークし、ARIMAやテキストのみのLLMベースのプロンプト手法を含む。
VISTAはこれらのベースラインを最大89.83%上回り、株価時系列分析におけるマルチモーダル推論の有効性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stock price prediction remains a complex and high-stakes task in financial analysis, traditionally addressed using statistical models or, more recently, language models. In this work, we introduce VISTA (Vision-Language Inference for Stock Time-series Analysis), a novel, training-free framework that leverages Vision-Language Models (VLMs) for multi-modal stock forecasting. VISTA prompts a VLM with both textual representations of historical stock prices and their corresponding line charts to predict future price values. By combining numerical and visual modalities in a zero-shot setting and using carefully designed chain-of-thought prompts, VISTA captures complementary patterns that unimodal approaches often miss. We benchmark VISTA against standard baselines, including ARIMA and text-only LLM-based prompting methods. Experimental results show that VISTA outperforms these baselines by up to 89.83%, demonstrating the effectiveness of multi-modal inference for stock time-series analysis and highlighting the potential of VLMs in financial forecasting tasks without requiring task-specific training.
- Abstract(参考訳): 株価の予測は、伝統的に統計モデルや近年では言語モデルを用いて対処される金融分析において、複雑で高額な課題であり続けている。
本稿では,VISTA(Vision-Language Inference for Stock Time-Series Analysis)を紹介する。
VISTAは、過去の株価とそれに対応するラインチャートの両方をテキストで表したVLMに、将来の価格値を予測するよう促す。
ゼロショット設定における数値と視覚のモダリティを組み合わせて、慎重に設計されたチェーン・オブ・シントプロンプトを使用することで、VISTAは、非モーダルアプローチがしばしば見逃す相補的なパターンをキャプチャする。
我々は、標準ベースラインに対してVISTAをベンチマークし、ARIMAやテキストのみのLLMベースのプロンプト手法を含む。
実験の結果、VISTAはこれらのベースラインを最大89.83%上回り、株価時系列分析におけるマルチモーダル推論の有効性を示し、タスク固有のトレーニングを必要とせず、財務予測タスクにおけるVLMの可能性を強調した。
関連論文リスト
- Evaluating Financial Sentiment Analysis with Annotators Instruction Assisted Prompting: Enhancing Contextual Interpretation and Stock Prediction Accuracy [1.481550828146527]
アノテータによるAIAP(Instruction Assisted Prompt)は、人間と機械の両方の解釈における感情の理解を標準化することを目的としている。
We use a new data, WSBS, derived from the WallStreetBets subreddit to demonstrate how AIAP significantly enhances LLM performance。
この文脈認識アプローチは、パフォーマンスの漸進的な向上をもたらし、また革新的な感情インデクシング手法も導入する。
論文 参考訳(メタデータ) (2025-05-09T19:44:04Z) - BreakGPT: Leveraging Large Language Models for Predicting Asset Price Surges [55.2480439325792]
本稿では,時系列予測や資産価格の急上昇の予測に特化して,新たな大規模言語モデル(LLM)アーキテクチャであるBreakGPTを紹介する。
我々は、最小限のトレーニングで財務予測を行うための有望なソリューションとしてBreakGPTを紹介し、局所的およびグローバルな時間的依存関係をキャプチャする強力な競合相手として紹介する。
論文 参考訳(メタデータ) (2024-11-09T05:40:32Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - StockTime: A Time Series Specialized Large Language Model Architecture for Stock Price Prediction [13.52020491768311]
株価時系列データに特化して設計された新しいLCMベースのアーキテクチャであるStockTimeを紹介する。
最近のFinLLMとは異なり、StockTimeは特に株価時系列データのために設計されている。
このマルチモーダルデータを融合させることで、StockTimeは任意の見返り期間の株価を効果的に予測する。
論文 参考訳(メタデータ) (2024-08-25T00:50:33Z) - Multi-modal Auto-regressive Modeling via Visual Words [96.25078866446053]
本稿では,視覚的特徴を大規模多モードモデルの語彙上の確率分布にマッピングする視覚トークンの概念を提案する。
さらに、LMM内の意味空間における視覚的特徴の分布と、視覚情報を表現するためにテキスト埋め込みを使用することの可能性について検討する。
論文 参考訳(メタデータ) (2024-03-12T14:58:52Z) - FinVis-GPT: A Multimodal Large Language Model for Financial Chart
Analysis [15.20897845057384]
FinVis-GPTは、財務チャート分析に特化して設計された、新しいマルチモーダル大言語モデル(LLM)である。
提案されたFinVis-GPTは、金融分野におけるマルチモーダル LLM の利用の先駆的な取り組みである。
論文 参考訳(メタデータ) (2023-07-31T07:44:15Z) - Behind the Scene: Revealing the Secrets of Pre-trained
Vision-and-Language Models [65.19308052012858]
最近のTransformerベースの大規模事前学習モデルは、視覚言語(V+L)研究に革命をもたらした。
VALUEは,マルチモーダル事前学習における内部動作の解明を目的とした,精密に設計された探索タスクのセットである。
主要な観察:事前訓練されたモデルは、推論中の画像よりもテキストに出席する傾向を示す。
論文 参考訳(メタデータ) (2020-05-15T01:06:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。