論文の概要: Deep Learning based Topic Analysis on Financial Emerging Event Tweets
- arxiv url: http://arxiv.org/abs/2008.00670v1
- Date: Mon, 3 Aug 2020 06:43:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 06:24:37.529954
- Title: Deep Learning based Topic Analysis on Financial Emerging Event Tweets
- Title(参考訳): ディープラーニングを用いた金融新興イベントツイートのトピック分析
- Authors: Shaan Aryaman and Nguwi Yok Yen
- Abstract要約: 本研究は,28264件の金融つぶやきをクラスタリングにより分析し,市場における新興事象の発見を行った。
この期間に3つの主要な話題が頻繁に議論された。
株式、石油、エネルギー部門の短期販売は政策とともに議論された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Financial analyses of stock markets rely heavily on quantitative approaches
in an attempt to predict subsequent or market movements based on historical
prices and other measurable metrics. These quantitative analyses might have
missed out on un-quantifiable aspects like sentiment and speculation that also
impact the market. Analyzing vast amounts of qualitative text data to
understand public opinion on social media platform is one approach to address
this gap. This work carried out topic analysis on 28264 financial tweets [1]
via clustering to discover emerging events in the stock market. Three main
topics were discovered to be discussed frequently within the period. First, the
financial ratio EPS is a measure that has been discussed frequently by
investors. Secondly, short selling of shares were discussed heavily, it was
often mentioned together with Morgan Stanley. Thirdly, oil and energy sectors
were often discussed together with policy. These tweets were semantically
clustered by a method consisting of word2vec algorithm to obtain word
embeddings that map words to vectors. Semantic word clusters were then formed.
Each tweet was then vectorized using the Term Frequency-Inverse Document
Frequency (TF-IDF) values of the words it consisted of and based on which
clusters its words were in. Tweet vectors were then converted to compressed
representations by training a deep-autoencoder. K-means clusters were then
formed. This method reduces dimensionality and produces dense vectors, in
contrast to the usual Vector Space Model. Topic modelling with Latent Dirichlet
Allocation (LDA) and top frequent words were used to analyze clusters and
reveal emerging events.
- Abstract(参考訳): 株式市場の財務分析は、過去の価格やその他の測定可能な指標に基づいて、後続または市場の動きを予測するために、量的アプローチに大きく依存している。
これらの定量的分析は、市場に影響を与える感情や憶測のような、定量化できない側面を見逃したかもしれない。
大量の質的テキストデータを分析してソーシャルメディアプラットフォーム上の世論を理解することは、このギャップに対処するアプローチのひとつだ。
本研究では,28264件の金融ツイートのトピック分析を行った。
この期間に3つの主要な話題が頻繁に議論された。
まず、EPSは投資家の間で頻繁に議論されている指標である。
第二に、株式の短い売却が議論され、しばしばモルガン・スタンレーと共に言及された。
第3に、石油とエネルギー部門は政策とともにしばしば議論された。
これらのツイートは、単語をベクトルにマップする単語埋め込みを得るためにword2vecアルゴリズムからなる方法で意味的にクラスタ化されていた。
その後、セマンティックな単語集合が形成された。
各ツイートは、その単語がどのクラスタにあるかに基づいて、その単語のTF-IDF(Term Frequency-Inverse Document Frequency)値を用いてベクトル化された。
ツイートベクトルは、ディープオートエンコーダをトレーニングすることで圧縮表現に変換される。
その後、K平均クラスターが形成された。
この方法は次元を減少させ、通常のベクトル空間モデルとは対照的に密度の高いベクトルを生成する。
Latent Dirichlet Allocation (LDA)と上位頻繁な単語を用いたトピックモデリングは、クラスタを分析し、出現するイベントを明らかにするために使用された。
関連論文リスト
- Stock Movement and Volatility Prediction from Tweets, Macroeconomic
Factors and Historical Prices [20.574163667057476]
株式市場の予測にツイートデータを使用した以前の研究は、3つの課題に直面した。
ECONには、大量のツイートデータを効率的に抽出し、デコードするアデプトツイートフィルタがある。
意味空間における自己認識機構を通じて、ストック、セクター、マクロ経済要因間の多水準関係を識別する。
論文 参考訳(メタデータ) (2023-12-04T22:27:43Z) - Multi-Label Topic Model for Financial Textual Data [0.0]
私は、ドイツのアドホックな発表3,044件からなる新しい金融マルチラベルデータベースでモデルをトレーニングします。
このモデルの適用として、トピック間の株式市場反応の相違について検討する。
論文 参考訳(メタデータ) (2023-11-10T12:56:07Z) - Predicting Financial Market Trends using Time Series Analysis and
Natural Language Processing [0.0]
この調査は、TeslaやAppleといった大手企業の株価を予測するためのツールとして、Twitterの感情の有効性を評価することを目的としている。
以上の結果から, 株価変動の主要な要因は, 肯定性, 否定性, 主観性であることが示唆された。
論文 参考訳(メタデータ) (2023-08-31T21:20:58Z) - Taureau: A Stock Market Movement Inference Framework Based on Twitter
Sentiment Analysis [0.0]
我々はTwitterの感情分析を利用して株式市場の動きを予測するフレームワークTaureauを提案する。
まずはTweepyとgetOldTweetsを使って、一連のトップ企業の世論を示す歴史的なツイートを入手する。
得られた感情スコアの時間次元を月次株価変動データと相関する。
論文 参考訳(メタデータ) (2023-03-30T19:12:08Z) - The Battle of Information Representations: Comparing Sentiment and
Semantic Features for Forecasting Market Trends [0.5249805590164902]
市場の動向を予測するための感情属性よりも文脈埋め込みの形での意味的特徴が重要であるかを検討する。
当社は、NASDAQの資本化による大手企業に関連するTwitter投稿のコーパスとその価格設定について検討する。
以上の結果から,感情的特徴の活用により,有意な頻度で測定値が上昇することが示唆された。
論文 参考訳(メタデータ) (2023-03-24T18:30:15Z) - Quantum computational finance: martingale asset pricing for incomplete
markets [69.73491758935712]
金融の価格問題に様々な量子技術を適用することができることを示す。
従来の研究と異なる3つの方法について議論する。
論文 参考訳(メタデータ) (2022-09-19T09:22:01Z) - A Word is Worth A Thousand Dollars: Adversarial Attack on Tweets Fools
Stock Prediction [100.9772316028191]
本稿では,3つのストック予測犠牲者モデルを騙すために,様々な攻撃構成を試行する。
以上の結果から,提案手法が一貫した成功率を達成し,取引シミュレーションにおいて大きな損失をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-01T05:12:22Z) - Did the Cat Drink the Coffee? Challenging Transformers with Generalized
Event Knowledge [59.22170796793179]
Transformers Language Models (TLMs) を数学的適合のテクトダイナミックな評価のためのベンチマークで検証した。
以上の結果から, TLM は SDM に匹敵する性能が得られることが示された。
しかし、さらなる分析は、TLMがイベント知識の重要な側面を捉えていないことを一貫して示唆している。
論文 参考訳(メタデータ) (2021-07-22T20:52:26Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - A Sentiment Analysis Approach to the Prediction of Market Volatility [62.997667081978825]
金融ニュースとツイートから抽出された感情とFTSE100の動きの関係を調べました。
ニュース見出しから得られた感情は、市場のリターンを予測するシグナルとして使われる可能性があるが、ボラティリティには当てはまらない。
我々は,新たな情報の到着に応じて,市場の変動を予測するための正確な分類器を開発した。
論文 参考訳(メタデータ) (2020-12-10T01:15:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。