論文の概要: Word embeddings for topic modeling: an application to the estimation of
the economic policy uncertainty index
- arxiv url: http://arxiv.org/abs/2111.00057v1
- Date: Fri, 29 Oct 2021 19:31:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-05 02:55:00.391426
- Title: Word embeddings for topic modeling: an application to the estimation of
the economic policy uncertainty index
- Title(参考訳): トピックモデリングのための単語埋め込み:経済政策の不確実性指標の推定への応用
- Authors: Hairo U. Miranda Belmonte and Victor Mu\~niz-S\'anchez and Francisco
Corona
- Abstract要約: 経済不確実性の定量化は、GDPのようなマクロ経済変数の予測の鍵となる概念である。
経済政策の不確実性指数(EPU)は、不確実性を定量化する最もよく使われる新聞ベースの指標である。
本稿では,デジタルニュースのトピックモデリングを高速かつ効率的に行うEPUインデックスを推定する手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantification of economic uncertainty is a key concept for the prediction of
macro economic variables such as gross domestic product (GDP), and it becomes
particularly relevant on real-time or short-time predictions methodologies,
such as nowcasting, where it is required a large amount of time series data,
commonly with different structures and frequencies. Most of the data comes from
the official agencies statistics and non-public institutions, however, relying
our estimates in just the traditional data mentioned before, have some
disadvantages. One of them is that economic uncertainty could not be
represented or measured in a proper way based solely in financial or
macroeconomic data, another one, is that they are susceptible to lack of
information due to extraordinary events, such as the current COVID-19 pandemic.
For these reasons, it is very common nowadays to use some non-traditional data
from different sources, such as social networks or digital newspapers, in
addition to the traditional data from official sources. The economic policy
uncertainty (EPU) index, is the most used newspaper-based indicator to quantify
the uncertainty, and is based on topic modeling of newspapers. In this paper,
we propose a methodology to estimate the EPU index, which incorporates a fast
and efficient method for topic modeling of digital news based on semantic
clustering with word embeddings, allowing to update the index in real-time,
which is a drawback with another proposals that use computationally intensive
methods for topic modeling, such as Latent Dirichlet Allocation (LDA). We show
that our proposal allow us to update the index and significantly reduces the
time required for new document assignation into topics.
- Abstract(参考訳): 経済不確実性の定量化は、国内総生産(GDP)などのマクロ経済変数の予測の鍵となる概念であり、通常、異なる構造や頻度で大量の時系列データを必要とする場合の、現在放送のようなリアルタイムまたは短時間の予測手法に特に関係している。
データのほとんどが政府機関統計と非公共機関からのものだが、前述の従来のデータだけに当てはまると、いくつかの欠点がある。
一つは、経済の不確実性は金融やマクロ経済のデータのみに基づいた適切な方法では表現できない、またもうひとつは、現在の新型コロナウイルス(covid-19)のパンデミックのような異常な出来事による情報不足の影響を受けやすいことだ。
これらの理由から、現在では、公式資料の伝統的なデータに加えて、ソーシャルネットワークやデジタル新聞など、さまざまな情報源の非伝統的なデータを使用するのが一般的である。
経済政策不確実性指数(EPU)は、不確実性の定量化に最も使用される新聞ベースの指標であり、新聞のトピック・モデリングに基づいている。
本稿では,単語埋め込みによる意味的クラスタリングに基づく,デジタルニュースのトピックモデリングのための高速かつ効率的な手法を組み込んだepuインデックスの推定手法を提案する。
提案手法によってインデックスを更新でき、トピックへの新規文書割り当てに必要な時間を大幅に短縮できることを示す。
関連論文リスト
- Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Editable Fairness: Fine-Grained Bias Mitigation in Language Models [52.66450426729818]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - Fast Model Debias with Machine Unlearning [54.32026474971696]
ディープニューラルネットワークは多くの現実世界のシナリオでバイアスのある振る舞いをする。
既存のデバイアス法は、バイアスラベルやモデル再トレーニングのコストが高い。
バイアスを特定し,評価し,除去するための効率的なアプローチを提供する高速モデル脱バイアスフレームワーク(FMD)を提案する。
論文 参考訳(メタデータ) (2023-10-19T08:10:57Z) - Conservative Predictions on Noisy Financial Data [6.300716661852326]
金融市場の価格変動は、非常に騒々しいことがよく知られている。
従来のルール学習技術は、高精度なルールのみを求め、先行者が適用されない予測を控えるものだった。
我々は、モデルが不確実であるデータポイントの予測を控える、同様のアプローチを適用する。
論文 参考訳(メタデータ) (2023-10-18T09:14:19Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Macroeconomic Predictions using Payments Data and Machine Learning [0.0]
本研究の目的は,非伝統的かつタイムリーなデータによって政策立案者がほぼリアルタイムで重要なマクロ経済指標を正確に推定する洗練されたモデルを提供できることを示すことである。
我々は、機械学習モデルにおける過度な適合と解釈可能性の課題を軽減し、ポリシー使用の有効性を改善するための、一連の計量的ツールを提供する。
支払いデータ、非線形手法、クロスバリデーション(クロスバリデーション)アプローチを備えた当社のモデルは、新型コロナウイルス(COVID-19)の期間中に上昇するマクロ経済の予測精度を最大40%向上させるのに役立ちます。
論文 参考訳(メタデータ) (2022-09-02T11:12:10Z) - Weak Supervision in Analysis of News: Application to Economic Policy
Uncertainty [0.0]
我々の研究は、経済政策の不確実性(EPU)を測定するためのテキストデータ、特にニュース作品の可能性の研究に焦点を当てている。
経済政策の不確実性は、新しい政策と将来の経済基本の下で、決定の結果を予測できないと定義されている。
本研究は、経済政策の不確実性に関して、ニュース記事の分類を弱くする機械学習ベースのソリューションを提案する。
論文 参考訳(メタデータ) (2022-08-10T09:08:29Z) - Benchmarking Econometric and Machine Learning Methodologies in
Nowcasting [0.0]
Nowcastingは、政策立案者に対して、かなりのタイムラグで公表されたデータに対するタイムリな洞察を与える上で、重要な役割を果たす可能性がある。
本稿では、米国の四半期GDP成長の予測において、12の異なる手法の性能について検討する。
アメリカ経済史の3つの異なる期間において、パフォーマンスが評価された。
論文 参考訳(メタデータ) (2022-05-06T15:51:31Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Aggregate Learning for Mixed Frequency Data [0.0]
本研究では,小規模地域の経済指標をリアルタイムに予測する混合時間集合学習モデルを提案する。
提案モデルでは, 労働市場状態の地域的不均一性を予測し, 急速に変化する経済状況を予測する。
このモデルは様々なタスク、特に経済分析に適用できる。
論文 参考訳(メタデータ) (2021-05-20T08:12:43Z) - Super-App Behavioral Patterns in Credit Risk Models: Financial,
Statistical and Regulatory Implications [110.54266632357673]
従来の官僚データとは対照的に、アプリベースのマーケットプレースから派生した代替データが信用スコアモデルに与える影響を提示する。
2つの国にまたがって検証した結果、これらの新たなデータソースは、低体重者や若年者における金融行動を予測するのに特に有用であることが示された。
論文 参考訳(メタデータ) (2020-05-09T01:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。