論文の概要: Text Mining of Stocktwits Data for Predicting Stock Prices
- arxiv url: http://arxiv.org/abs/2103.16388v1
- Date: Sat, 13 Mar 2021 03:29:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 03:29:03.298464
- Title: Text Mining of Stocktwits Data for Predicting Stock Prices
- Title(参考訳): 株価予測のための株価データのテキストマイニング
- Authors: Mukul Jaggi, Priyanka Mandal, Shreya Narang, Usman Naseem and Matloob
Khushi
- Abstract要約: FinALBERTは、株価変化に基づいてStocktwitsテキストデータをラベル付けすることで、金融分野のテキスト分類タスクを処理するように訓練されている。
私たちは主要な5つのFAANG(Facebook、Amazon、Apple、Netflix、Google)を含む25の異なる企業のために10年以上Stocktwitsデータを収集しました。
- 参考スコア(独自算出の注目度): 3.3554367023486935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stock price prediction can be made more efficient by considering the price
fluctuations and understanding the sentiments of people. A limited number of
models understand financial jargon or have labelled datasets concerning stock
price change. To overcome this challenge, we introduced FinALBERT, an ALBERT
based model trained to handle financial domain text classification tasks by
labelling Stocktwits text data based on stock price change. We collected
Stocktwits data for over ten years for 25 different companies, including the
major five FAANG (Facebook, Amazon, Apple, Netflix, Google). These datasets
were labelled with three labelling techniques based on stock price changes. Our
proposed model FinALBERT is fine-tuned with these labels to achieve optimal
results. We experimented with the labelled dataset by training it on
traditional machine learning, BERT, and FinBERT models, which helped us
understand how these labels behaved with different model architectures. Our
labelling method competitive advantage is that it can help analyse the
historical data effectively, and the mathematical function can be easily
customised to predict stock movement.
- Abstract(参考訳): 価格変動を考慮し、人々の感情を理解することで、株価予測をより効率的にすることができる。
限られた数のモデルが金融用語を理解したり、株価の変動に関するデータセットをラベル付けしている。
この課題を克服するために、株価変化に基づいてStocktwitsテキストデータをラベル付けすることで、財務分野のテキスト分類タスクを処理するために訓練されたALBERTベースのモデルであるFinALBERTを導入した。
当社は、主要な5つのFAANG(Facebook、Amazon、Apple、Netflix、Google)を含む25の企業を対象に、10年以上にわたってStocktwitsのデータを収集しました。
これらのデータセットは、株価変動に基づく3つのラベル付け技術でラベル付けされた。
提案するモデルFinALBERTは,これらのラベルを微調整して最適な結果を得る。
従来の機械学習、BERT、FinBERTモデルに基づいてラベル付きデータセットをトレーニングすることで、ラベルがさまざまなモデルアーキテクチャでどのように振る舞ったかを理解するのに役立ちました。
我々のラベル付け手法の利点は,過去のデータを効果的に分析することであり,数理関数はストック移動を予測するために容易にカスタマイズできる点である。
関連論文リスト
- Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Improving CNN-base Stock Trading By Considering Data Heterogeneity and
Burst [1.6637373649145604]
入力データの空間的依存(行と列間の関係)を学習できるため,このようなフレームワークのコア機能としてCNNを用いる。
次に、ストックデータを作成するための新しい正規化プロセスを開発する。
実験結果から,本手法が他の比較手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-03-14T01:05:17Z) - Leveraging Vision-Language Models for Granular Market Change Prediction [5.54780083433538]
本研究は,処理したストックデータの画像およびバイト単位の数値表現を利用して,市場の動きを根本的に新しいアプローチでモデル化し,予測することを提案する。
我々は、ドイツ株指数の時間ごとの株価データについて大規模な実験を行い、過去の株価データを用いて株価予測に基づいて様々なアーキテクチャを評価する。
評価の結果,ストックデータのテキスト(バイト)表現に基づく新しい手法が,画像の深層学習ベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-01-17T19:37:19Z) - Augmented Bilinear Network for Incremental Multi-Stock Time-Series
Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。
本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。
この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文 参考訳(メタデータ) (2022-07-23T18:54:10Z) - Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition [98.25592165484737]
CMPL(Cross-Model Pseudo-Labeling)と呼ばれる,より効果的な擬似ラベル方式を提案する。
CMPLは、それぞれRGBモダリティとラベル付きデータのみを使用して、Kinetics-400とUCF-101のTop-1の精度を17.6%と25.1%で達成している。
論文 参考訳(メタデータ) (2021-12-17T18:59:41Z) - A data-science-driven short-term analysis of Amazon, Apple, Google, and
Microsoft stocks [0.43012765978447565]
我々は,技術分析と機械/深層学習に基づく分析を組み合わせることで,トレンド分類モデルを構築する。
我々は、現在の株式市場データの価格動向に依存する短期的な予測を行うデータサイエンス駆動技術を実行する。
論文 参考訳(メタデータ) (2021-07-30T15:19:52Z) - How to distribute data across tasks for meta-learning? [59.608652082495624]
タスクごとのデータポイントの最適な数は予算に依存しますが、それは大きな予算のためのユニークな一定の値に収束します。
この結果から,データ収集の簡便かつ効率的な手順が示唆された。
論文 参考訳(メタデータ) (2021-03-15T15:38:47Z) - The LOB Recreation Model: Predicting the Limit Order Book from TAQ
History Using an Ordinary Differential Equation Recurrent Neural Network [9.686252465354274]
LOBレクリエーションモデルは,小額株の公開制限注文書(LOB)のトップ5価格レベルを再現するための,ディープラーニングの観点からの最初の試みである。
トランスファーラーニングのパラダイムにより、同じクラスの他の金融資産に適用できるように、ある株式で訓練されたソースモデルを微調整することができる。
論文 参考訳(メタデータ) (2021-03-02T12:07:43Z) - Evaluating data augmentation for financial time series classification [85.38479579398525]
2つの最先端ディープラーニングモデルを用いて,ストックデータセットに適用したいくつかの拡張手法を評価する。
比較的小さなデータセット拡張手法では、リスク調整された戻り値のパフォーマンスが最大400%向上する。
より大きなストックデータセット拡張メソッドでは、最大40%の改善が達成される。
論文 参考訳(メタデータ) (2020-10-28T17:53:57Z) - An Empirical Study on Large-Scale Multi-Label Text Classification
Including Few and Zero-Shot Labels [49.036212158261215]
大規模なMulti-label Text Classification (LMTC) は、幅広い自然言語処理 (NLP) アプリケーションを持つ。
Label-Wise Attention Networks (LWANs) を用いた最新のLMTCモデル
確率的ラベル木(PLT)に基づく階層的手法がLWANより優れていることを示す。
BERTとLWANを組み合わせた最先端手法を提案する。
論文 参考訳(メタデータ) (2020-10-04T18:55:47Z) - Multi-Graph Convolutional Network for Relationship-Driven Stock Movement
Prediction [19.58023036416987]
ストックムーブメントを予測するために,Multi-GCGRUと呼ばれるディープラーニングフレームワークを提案する。
まず、金融分野の知識に基づいて、株間の複数の関係をグラフにエンコードする。
先行知識を更に排除するために,データから学習した適応関係を探索する。
論文 参考訳(メタデータ) (2020-05-11T09:31:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。