論文の概要: Social media data reveals signal for public consumer perceptions
- arxiv url: http://arxiv.org/abs/2012.13675v1
- Date: Sat, 26 Dec 2020 03:58:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 01:13:51.404604
- Title: Social media data reveals signal for public consumer perceptions
- Title(参考訳): ソーシャルメディアが消費者の認識のシグナルを公表
- Authors: Neeti Pokhriyal, Abenezer Dara, Benjamin Valentino, Soroush Vosoughi
- Abstract要約: 最も広く引用されている経済指標の1つは、消費者信頼指数(CCI)です。
これまで多くの研究がソーシャルメディア、特にTwitterデータを使ってCCIを予測することに重点を置いてきた。
しかし、最近の包括的調査によると、これらのモデルが新しいデータでテストされると、強い相関関係は消失した。
- 参考スコア(独自算出の注目度): 6.212955085775758
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Researchers have used social media data to estimate various macroeconomic
indicators about public behaviors, mostly as a way to reduce surveying costs.
One of the most widely cited economic indicator is consumer confidence index
(CCI). Numerous studies in the past have focused on using social media,
especially Twitter data, to predict CCI. However, the strong correlations
disappeared when those models were tested with newer data according to a recent
comprehensive survey. In this work, we revisit this problem of assessing the
true potential of using social media data to measure CCI, by proposing a robust
non-parametric Bayesian modeling framework grounded in Gaussian Process
Regression (which provides both an estimate and an uncertainty associated with
it). Integral to our framework is a principled experimentation methodology that
demonstrates how digital data can be employed to reduce the frequency of
surveys, and thus periodic polling would be needed only to calibrate our model.
Via extensive experimentation we show how the choice of different
micro-decisions, such as the smoothing interval, various types of lags etc.
have an important bearing on the results. By using decadal data (2008-2019)
from Reddit, we show that both monthly and daily estimates of CCI can, indeed,
be reliably estimated at least several months in advance, and that our model
estimates are far superior to those generated by the existing methods.
- Abstract(参考訳): 研究者たちはソーシャルメディアのデータを使って、公共の行動に関する様々なマクロ経済指標を推定してきた。
最も広く引用されている経済指標の1つは消費者信頼指数(CCI)である。
これまで多くの研究がソーシャルメディア、特にTwitterデータを使ってCCIを予測することに重点を置いてきた。
しかし、最近の包括的調査によると、これらのモデルが新しいデータでテストされると、強い相関関係は消失した。
本稿では,ガウス過程の回帰(推定とそれに関連する不確実性の両方を提供する)を基礎としたロバストな非パラメトリックベイズモデリングフレームワークを提案することにより,ソーシャルメディアデータを用いたcci測定の真の可能性を評価する問題を再考する。
我々のフレームワークと一体化することは、調査頻度を減らすためにデジタルデータをいかに活用できるかを実証する原理的な実験手法であり、定期的なポーリングは我々のモデルを校正するためにのみ必要である。
広範囲な実験により、スムーズな間隔や様々な種類のラグなど、異なるマイクロ決定の選択方法が示される。
結果に重要な影響を与えます
Redditのdecadal data (2008-2019) を用いて、CCIの月次推定と日次推定の両方が、少なくとも数ヶ月前に確実に予測可能であること、我々のモデル推定が既存の方法よりもはるかに優れていることを示します。
関連論文リスト
- A Study on the Evaluation of Generative Models [19.18642459565609]
潜在的生成モデルは、確率値を返さないが、近年は普及している。
本研究では,高品質な合成データセットの生成による生成モデルの評価指標について検討する。
FIDとISはいくつかのf-divergensと相関するが、クローズドモデルのランクは様々である。
論文 参考訳(メタデータ) (2022-06-22T09:27:31Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Benchmarking Econometric and Machine Learning Methodologies in
Nowcasting [0.0]
Nowcastingは、政策立案者に対して、かなりのタイムラグで公表されたデータに対するタイムリな洞察を与える上で、重要な役割を果たす可能性がある。
本稿では、米国の四半期GDP成長の予測において、12の異なる手法の性能について検討する。
アメリカ経済史の3つの異なる期間において、パフォーマンスが評価された。
論文 参考訳(メタデータ) (2022-05-06T15:51:31Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - MEMO: Test Time Robustness via Adaptation and Augmentation [131.28104376280197]
テスト時間ロバスト化の問題、すなわちモデルロバスト性を改善するためにテストインプットを用いて検討する。
最近の先行研究ではテスト時間適応法が提案されているが、それぞれ追加の仮定を導入している。
モデルが確率的で適応可能な任意のテスト環境で使用できるシンプルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-10-18T17:55:11Z) - Newer is not always better: Rethinking transferability metrics, their
peculiarities, stability and performance [7.820667552233989]
小さなカスタマイズされたデータセット上で、大規模で事前訓練された画像と言語モデルの微調整が人気を集めている。
共分散推定における統計的問題により,Hスコアの性能が低下することが示唆された。
対象(ソースではなく)タスク選択の設定において,これまで見過ごされていた問題を特定する。
論文 参考訳(メタデータ) (2021-10-13T17:24:12Z) - RIFLE: Robust Inference from Low Order Marginals [12.82736265401703]
我々は,不足した値を示唆することなく,対象変数を予測する統計的推論フレームワークを開発した。
我々のフレームワークであるRIFLEは、分布的に堅牢なモデルを学ぶために、対応する信頼区間を持つ低次モーメントを推定する。
実験の結果,RIFLEは,欠落値の割合が高い場合や,データポイント数が比較的小さい場合には,他のベンチマークアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-09-01T23:17:30Z) - Predicting Census Survey Response Rates via Interpretable Nonparametric
Additive Models with Structured Interactions [7.866556977836076]
我々は,調査における応答率を高精度に予測する新しい解釈可能な統計手法を提案する。
提案手法は,最先端の機械学習手法に予測性能を損なうことなく,解釈可能性を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-24T17:49:55Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。