論文の概要: Text Mining of Stocktwits Data for Predicting Stock Prices
- arxiv url: http://arxiv.org/abs/2103.16388v1
- Date: Sat, 13 Mar 2021 03:29:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 03:29:03.298464
- Title: Text Mining of Stocktwits Data for Predicting Stock Prices
- Title(参考訳): 株価予測のための株価データのテキストマイニング
- Authors: Mukul Jaggi, Priyanka Mandal, Shreya Narang, Usman Naseem and Matloob
Khushi
- Abstract要約: FinALBERTは、株価変化に基づいてStocktwitsテキストデータをラベル付けすることで、金融分野のテキスト分類タスクを処理するように訓練されている。
私たちは主要な5つのFAANG(Facebook、Amazon、Apple、Netflix、Google)を含む25の異なる企業のために10年以上Stocktwitsデータを収集しました。
- 参考スコア(独自算出の注目度): 3.3554367023486935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stock price prediction can be made more efficient by considering the price
fluctuations and understanding the sentiments of people. A limited number of
models understand financial jargon or have labelled datasets concerning stock
price change. To overcome this challenge, we introduced FinALBERT, an ALBERT
based model trained to handle financial domain text classification tasks by
labelling Stocktwits text data based on stock price change. We collected
Stocktwits data for over ten years for 25 different companies, including the
major five FAANG (Facebook, Amazon, Apple, Netflix, Google). These datasets
were labelled with three labelling techniques based on stock price changes. Our
proposed model FinALBERT is fine-tuned with these labels to achieve optimal
results. We experimented with the labelled dataset by training it on
traditional machine learning, BERT, and FinBERT models, which helped us
understand how these labels behaved with different model architectures. Our
labelling method competitive advantage is that it can help analyse the
historical data effectively, and the mathematical function can be easily
customised to predict stock movement.
- Abstract(参考訳): 価格変動を考慮し、人々の感情を理解することで、株価予測をより効率的にすることができる。
限られた数のモデルが金融用語を理解したり、株価の変動に関するデータセットをラベル付けしている。
この課題を克服するために、株価変化に基づいてStocktwitsテキストデータをラベル付けすることで、財務分野のテキスト分類タスクを処理するために訓練されたALBERTベースのモデルであるFinALBERTを導入した。
当社は、主要な5つのFAANG(Facebook、Amazon、Apple、Netflix、Google)を含む25の企業を対象に、10年以上にわたってStocktwitsのデータを収集しました。
これらのデータセットは、株価変動に基づく3つのラベル付け技術でラベル付けされた。
提案するモデルFinALBERTは,これらのラベルを微調整して最適な結果を得る。
従来の機械学習、BERT、FinBERTモデルに基づいてラベル付きデータセットをトレーニングすることで、ラベルがさまざまなモデルアーキテクチャでどのように振る舞ったかを理解するのに役立ちました。
我々のラベル付け手法の利点は,過去のデータを効果的に分析することであり,数理関数はストック移動を予測するために容易にカスタマイズできる点である。
関連論文リスト
- Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models [0.0]
市場の動きを予測するために,Large Language Models (LLMs) を採用している。
私たちのデータセットには、さまざまなソースから収集されたニュース記事、歴史的な株価、20社の財務報告データが含まれています。
このモデルを用いて、重み付きF1スコア58.5%および59.1%のデータセットにおいて、所定の株価の変動を予測した。
論文 参考訳(メタデータ) (2024-11-02T21:53:20Z) - A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers [70.20477771578824]
イベント予測への既存のアプローチには、タイムアウェアな位置埋め込み、学習行とフィールドエンコーディング、クラス不均衡に対処するオーバーサンプリング方法などがある。
基本位置埋め込みと因果言語モデリングの目的を持つ標準自己回帰型LPM変換器を用いて,単純だが柔軟なベースラインを提案する。
私たちのベースラインは、一般的なデータセットで既存のアプローチよりも優れており、さまざまなユースケースに使用することができます。
論文 参考訳(メタデータ) (2024-10-14T15:59:16Z) - Enhancing TinyBERT for Financial Sentiment Analysis Using GPT-Augmented FinBERT Distillation [0.0]
本研究では,大規模言語モデル(LLM)の生成能力を生かして,ドメイン固有の学習データを生成することを提案する。
この研究は、金融感情分析用に微調整されたBERTモデルであるFinBERTを強化し、コンパクトトランスモデルであるTinyFinBERTを開発することを目的としている。
論文 参考訳(メタデータ) (2024-09-19T10:22:23Z) - StockTime: A Time Series Specialized Large Language Model Architecture for Stock Price Prediction [13.52020491768311]
株価時系列データに特化して設計された新しいLCMベースのアーキテクチャであるStockTimeを紹介する。
最近のFinLLMとは異なり、StockTimeは特に株価時系列データのために設計されている。
このマルチモーダルデータを融合させることで、StockTimeは任意の見返り期間の株価を効果的に予測する。
論文 参考訳(メタデータ) (2024-08-25T00:50:33Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。
次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文 参考訳(メタデータ) (2024-03-19T09:45:33Z) - Improving CNN-base Stock Trading By Considering Data Heterogeneity and
Burst [1.6637373649145604]
入力データの空間的依存(行と列間の関係)を学習できるため,このようなフレームワークのコア機能としてCNNを用いる。
次に、ストックデータを作成するための新しい正規化プロセスを開発する。
実験結果から,本手法が他の比較手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-03-14T01:05:17Z) - Augmented Bilinear Network for Incremental Multi-Stock Time-Series
Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。
本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。
この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文 参考訳(メタデータ) (2022-07-23T18:54:10Z) - Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition [98.25592165484737]
CMPL(Cross-Model Pseudo-Labeling)と呼ばれる,より効果的な擬似ラベル方式を提案する。
CMPLは、それぞれRGBモダリティとラベル付きデータのみを使用して、Kinetics-400とUCF-101のTop-1の精度を17.6%と25.1%で達成している。
論文 参考訳(メタデータ) (2021-12-17T18:59:41Z) - A data-science-driven short-term analysis of Amazon, Apple, Google, and
Microsoft stocks [0.43012765978447565]
我々は,技術分析と機械/深層学習に基づく分析を組み合わせることで,トレンド分類モデルを構築する。
我々は、現在の株式市場データの価格動向に依存する短期的な予測を行うデータサイエンス駆動技術を実行する。
論文 参考訳(メタデータ) (2021-07-30T15:19:52Z) - Evaluating data augmentation for financial time series classification [85.38479579398525]
2つの最先端ディープラーニングモデルを用いて,ストックデータセットに適用したいくつかの拡張手法を評価する。
比較的小さなデータセット拡張手法では、リスク調整された戻り値のパフォーマンスが最大400%向上する。
より大きなストックデータセット拡張メソッドでは、最大40%の改善が達成される。
論文 参考訳(メタデータ) (2020-10-28T17:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。