Fugu-MT 論文翻訳(概要): Text Mining of Stocktwits Data for Predicting Stock Prices

論文の概要: Text Mining of Stocktwits Data for Predicting Stock Prices

arxiv url: http://arxiv.org/abs/2103.16388v1
Date: Sat, 13 Mar 2021 03:29:14 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-05 03:29:03.298464
Title: Text Mining of Stocktwits Data for Predicting Stock Prices
Title（参考訳）: 株価予測のための株価データのテキストマイニング
Authors: Mukul Jaggi, Priyanka Mandal, Shreya Narang, Usman Naseem and Matloob Khushi
Abstract要約: FinALBERTは、株価変化に基づいてStocktwitsテキストデータをラベル付けすることで、金融分野のテキスト分類タスクを処理するように訓練されている。私たちは主要な5つのFAANG(Facebook、Amazon、Apple、Netflix、Google)を含む25の異なる企業のために10年以上Stocktwitsデータを収集しました。
参考スコア（独自算出の注目度）: 3.3554367023486935
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Stock price prediction can be made more efficient by considering the price fluctuations and understanding the sentiments of people. A limited number of models understand financial jargon or have labelled datasets concerning stock price change. To overcome this challenge, we introduced FinALBERT, an ALBERT based model trained to handle financial domain text classification tasks by labelling Stocktwits text data based on stock price change. We collected Stocktwits data for over ten years for 25 different companies, including the major five FAANG (Facebook, Amazon, Apple, Netflix, Google). These datasets were labelled with three labelling techniques based on stock price changes. Our proposed model FinALBERT is fine-tuned with these labels to achieve optimal results. We experimented with the labelled dataset by training it on traditional machine learning, BERT, and FinBERT models, which helped us understand how these labels behaved with different model architectures. Our labelling method competitive advantage is that it can help analyse the historical data effectively, and the mathematical function can be easily customised to predict stock movement.
Abstract（参考訳）: 価格変動を考慮し、人々の感情を理解することで、株価予測をより効率的にすることができる。限られた数のモデルが金融用語を理解したり、株価の変動に関するデータセットをラベル付けしている。この課題を克服するために、株価変化に基づいてStocktwitsテキストデータをラベル付けすることで、財務分野のテキスト分類タスクを処理するために訓練されたALBERTベースのモデルであるFinALBERTを導入した。当社は、主要な5つのFAANG(Facebook、Amazon、Apple、Netflix、Google)を含む25の企業を対象に、10年以上にわたってStocktwitsのデータを収集しました。これらのデータセットは、株価変動に基づく3つのラベル付け技術でラベル付けされた。提案するモデルFinALBERTは,これらのラベルを微調整して最適な結果を得る。従来の機械学習、BERT、FinBERTモデルに基づいてラベル付きデータセットをトレーニングすることで、ラベルがさまざまなモデルアーキテクチャでどのように振る舞ったかを理解するのに役立ちました。我々のラベル付け手法の利点は,過去のデータを効果的に分析することであり,数理関数はストック移動を予測するために容易にカスタマイズできる点である。

関連論文リスト

Hey, That's My Data! Label-Only Dataset Inference in Large Language Models [63.35066172530291]
CatShiftはラベルのみのデータセット推論フレームワークである。 LLMは、新しいデータに晒されたとき、学習した知識を上書きする傾向にある。
論文参考訳（メタデータ） (2025-06-06T13:02:59Z)
Multimodal Stock Price Prediction: A Case Study of the Russian Securities Market [0.0]
本稿では,キャンドルスティック時系列とニュースフローデータを組み合わせたマルチモーダルアプローチを用いて,金融資産価格の予測問題に対処する。モスクワ証券取引所で取引されたロシア株176株と、ロシアの金融ニュース記事79,555株の時系列を含む、ユニークなデータセットが収集された。実験の結果, テキストのモダリティを組み込むことでMAPEの値が55%減少した。
論文参考訳（メタデータ） (2025-03-05T21:20:32Z)
FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。 FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文参考訳（メタデータ） (2025-02-26T05:19:16Z)
TLOB: A Novel Transformer Model with Dual Attention for Price Trend Prediction with Limit Order Book Data [10.684577067675585]
制限順序帳(LOB)データに基づく価格トレンド予測(PTP)は、金融市場における根本的な課題である。 LOBデータにおける空間的および時間的依存関係を捉えるために,デュアルアテンション機構を用いたトランスフォーマーベースモデルTLOBを提案する。 F1スコアの6.68は、市場効率の上昇を浮き彫りにしている。
論文参考訳（メタデータ） (2025-02-12T12:41:10Z)
An Instrumental Value for Data Production and its Application to Data Pricing [107.98697414652479]
本稿では,データ生成プロセスのインストゥルメンタルな価値を捉えるためのアプローチを開発する。情報経済学における情報設計と信号の古典的概念とどのように結びつくかを示す。
論文参考訳（メタデータ） (2024-12-24T03:53:57Z)
Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models [0.0]
市場の動きを予測するために,Large Language Models (LLMs) を採用している。私たちのデータセットには、さまざまなソースから収集されたニュース記事、歴史的な株価、20社の財務報告データが含まれています。このモデルを用いて、重み付きF1スコア58.5%および59.1%のデータセットにおいて、所定の株価の変動を予測した。
論文参考訳（メタデータ） (2024-11-02T21:53:20Z)
A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers [70.20477771578824]
イベント予測への既存のアプローチには、タイムアウェアな位置埋め込み、学習行とフィールドエンコーディング、クラス不均衡に対処するオーバーサンプリング方法などがある。基本位置埋め込みと因果言語モデリングの目的を持つ標準自己回帰型LPM変換器を用いて,単純だが柔軟なベースラインを提案する。私たちのベースラインは、一般的なデータセットで既存のアプローチよりも優れており、さまざまなユースケースに使用することができます。
論文参考訳（メタデータ） (2024-10-14T15:59:16Z)
Enhancing TinyBERT for Financial Sentiment Analysis Using GPT-Augmented FinBERT Distillation [0.0]
本研究では,大規模言語モデル(LLM)の生成能力を生かして,ドメイン固有の学習データを生成することを提案する。この研究は、金融感情分析用に微調整されたBERTモデルであるFinBERTを強化し、コンパクトトランスモデルであるTinyFinBERTを開発することを目的としている。
論文参考訳（メタデータ） (2024-09-19T10:22:23Z)
StockTime: A Time Series Specialized Large Language Model Architecture for Stock Price Prediction [13.52020491768311]
株価時系列データに特化して設計された新しいLCMベースのアーキテクチャであるStockTimeを紹介する。最近のFinLLMとは異なり、StockTimeは特に株価時系列データのために設計されている。このマルチモーダルデータを融合させることで、StockTimeは任意の見返り期間の株価を効果的に予測する。
論文参考訳（メタデータ） (2024-08-25T00:50:33Z)
Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文参考訳（メタデータ） (2024-06-05T20:19:09Z)
AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文参考訳（メタデータ） (2024-03-19T09:45:33Z)
Improving CNN-base Stock Trading By Considering Data Heterogeneity and Burst [1.6637373649145604]
入力データの空間的依存(行と列間の関係)を学習できるため,このようなフレームワークのコア機能としてCNNを用いる。次に、ストックデータを作成するための新しい正規化プロセスを開発する。実験結果から,本手法が他の比較手法より優れていることが示された。
論文参考訳（メタデータ） (2023-03-14T01:05:17Z)
Augmented Bilinear Network for Incremental Multi-Stock Time-Series Classification [83.23129279407271]
本稿では,有価証券のセットで事前学習したニューラルネットワークで利用可能な知識を効率的に保持する手法を提案する。本手法では,既存の接続を固定することにより,事前学習したニューラルネットワークに符号化された事前知識を維持する。この知識は、新しいデータを用いて最適化された一連の拡張接続によって、新しい証券に対して調整される。
論文参考訳（メタデータ） (2022-07-23T18:54:10Z)
Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition [98.25592165484737]
CMPL(Cross-Model Pseudo-Labeling)と呼ばれる,より効果的な擬似ラベル方式を提案する。 CMPLは、それぞれRGBモダリティとラベル付きデータのみを使用して、Kinetics-400とUCF-101のTop-1の精度を17.6%と25.1%で達成している。
論文参考訳（メタデータ） (2021-12-17T18:59:41Z)
A data-science-driven short-term analysis of Amazon, Apple, Google, and Microsoft stocks [0.43012765978447565]
我々は,技術分析と機械/深層学習に基づく分析を組み合わせることで,トレンド分類モデルを構築する。我々は、現在の株式市場データの価格動向に依存する短期的な予測を行うデータサイエンス駆動技術を実行する。
論文参考訳（メタデータ） (2021-07-30T15:19:52Z)
Evaluating data augmentation for financial time series classification [85.38479579398525]
2つの最先端ディープラーニングモデルを用いて,ストックデータセットに適用したいくつかの拡張手法を評価する。比較的小さなデータセット拡張手法では、リスク調整された戻り値のパフォーマンスが最大400%向上する。より大きなストックデータセット拡張メソッドでは、最大40%の改善が達成される。
論文参考訳（メタデータ） (2020-10-28T17:53:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。