論文の概要: Social media data reveals signal for public consumer perceptions
- arxiv url: http://arxiv.org/abs/2012.13675v1
- Date: Sat, 26 Dec 2020 03:58:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 01:13:51.404604
- Title: Social media data reveals signal for public consumer perceptions
- Title(参考訳): ソーシャルメディアが消費者の認識のシグナルを公表
- Authors: Neeti Pokhriyal, Abenezer Dara, Benjamin Valentino, Soroush Vosoughi
- Abstract要約: 最も広く引用されている経済指標の1つは、消費者信頼指数(CCI)です。
これまで多くの研究がソーシャルメディア、特にTwitterデータを使ってCCIを予測することに重点を置いてきた。
しかし、最近の包括的調査によると、これらのモデルが新しいデータでテストされると、強い相関関係は消失した。
- 参考スコア(独自算出の注目度): 6.212955085775758
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Researchers have used social media data to estimate various macroeconomic
indicators about public behaviors, mostly as a way to reduce surveying costs.
One of the most widely cited economic indicator is consumer confidence index
(CCI). Numerous studies in the past have focused on using social media,
especially Twitter data, to predict CCI. However, the strong correlations
disappeared when those models were tested with newer data according to a recent
comprehensive survey. In this work, we revisit this problem of assessing the
true potential of using social media data to measure CCI, by proposing a robust
non-parametric Bayesian modeling framework grounded in Gaussian Process
Regression (which provides both an estimate and an uncertainty associated with
it). Integral to our framework is a principled experimentation methodology that
demonstrates how digital data can be employed to reduce the frequency of
surveys, and thus periodic polling would be needed only to calibrate our model.
Via extensive experimentation we show how the choice of different
micro-decisions, such as the smoothing interval, various types of lags etc.
have an important bearing on the results. By using decadal data (2008-2019)
from Reddit, we show that both monthly and daily estimates of CCI can, indeed,
be reliably estimated at least several months in advance, and that our model
estimates are far superior to those generated by the existing methods.
- Abstract(参考訳): 研究者たちはソーシャルメディアのデータを使って、公共の行動に関する様々なマクロ経済指標を推定してきた。
最も広く引用されている経済指標の1つは消費者信頼指数(CCI)である。
これまで多くの研究がソーシャルメディア、特にTwitterデータを使ってCCIを予測することに重点を置いてきた。
しかし、最近の包括的調査によると、これらのモデルが新しいデータでテストされると、強い相関関係は消失した。
本稿では,ガウス過程の回帰(推定とそれに関連する不確実性の両方を提供する)を基礎としたロバストな非パラメトリックベイズモデリングフレームワークを提案することにより,ソーシャルメディアデータを用いたcci測定の真の可能性を評価する問題を再考する。
我々のフレームワークと一体化することは、調査頻度を減らすためにデジタルデータをいかに活用できるかを実証する原理的な実験手法であり、定期的なポーリングは我々のモデルを校正するためにのみ必要である。
広範囲な実験により、スムーズな間隔や様々な種類のラグなど、異なるマイクロ決定の選択方法が示される。
結果に重要な影響を与えます
Redditのdecadal data (2008-2019) を用いて、CCIの月次推定と日次推定の両方が、少なくとも数ヶ月前に確実に予測可能であること、我々のモデル推定が既存の方法よりもはるかに優れていることを示します。
関連論文リスト
- Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - MRCLens: an MRC Dataset Bias Detection Toolkit [82.44296974850639]
MRCLensは,ユーザがフルモデルをトレーニングする前に,バイアスが存在するかどうかを検出するツールキットである。
ツールキットの導入の便宜のために,MDCにおける共通バイアスの分類も提供する。
論文 参考訳(メタデータ) (2022-07-18T21:05:39Z) - A Study on the Evaluation of Generative Models [19.18642459565609]
潜在的生成モデルは、確率値を返さないが、近年は普及している。
本研究では,高品質な合成データセットの生成による生成モデルの評価指標について検討する。
FIDとISはいくつかのf-divergensと相関するが、クローズドモデルのランクは様々である。
論文 参考訳(メタデータ) (2022-06-22T09:27:31Z) - Newer is not always better: Rethinking transferability metrics, their
peculiarities, stability and performance [5.650647159993238]
小さなカスタマイズされたデータセット上で、大規模で事前訓練された画像と言語モデルの微調整が人気を集めている。
共分散推定における統計的問題により,Hスコアの性能が低下することが示唆された。
そこで我々は,そのような設定における相対的精度に対する相関性能を補正し,評価することを推奨する。
論文 参考訳(メタデータ) (2021-10-13T17:24:12Z) - Predicting Census Survey Response Rates With Parsimonious Additive
Models and Structured Interactions [14.003044924094597]
本研究では, フレキシブルで解釈可能な非パラメトリックモデル群を用いて, アンケート応答率を予測することの問題点を考察する。
この研究は、米国国勢調査局(US Census Bureau)の有名なROAMアプリケーションによって動機付けられている。
論文 参考訳(メタデータ) (2021-08-24T17:49:55Z) - Causal Inference with Corrupted Data: Measurement Error, Missing Values,
Discretization, and Differential Privacy [6.944765747195337]
高次元の劣化データを用いて半パラメトリックな因果推論モデルを定式化する。
有限サンプル引数による一貫性とガウス近似を証明する。
我々の分析は、行列補完、統計的学習、および半パラメトリック統計に対する漸近的理論的貢献を提供する。
論文 参考訳(メタデータ) (2021-07-06T17:42:49Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。