論文の概要: Words That Unite The World: A Unified Framework for Deciphering Central Bank Communications Globally
- arxiv url: http://arxiv.org/abs/2505.17048v1
- Date: Thu, 15 May 2025 19:49:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-01 23:16:01.402277
- Title: Words That Unite The World: A Unified Framework for Deciphering Central Bank Communications Globally
- Title(参考訳): 世界を統合する言葉:中央銀行のコミュニケーションをグローバルに解読するための統一されたフレームワーク
- Authors: Agam Shah, Siddhant Sukhani, Huzaifa Pardawala, Saketh Budideti, Riya Bhadani, Rudra Gopal, Siddhartha Somani, Michael Galarnyk, Soungmin Lee, Arnav Hiray, Akshar Ravichandran, Eric Kim, Pranav Aluru, Joshua Zhang, Sebastian Jaskowski, Veer Guda, Meghaj Tarte, Liqin Ye, Spencer Gosden, Rutwik Routu, Rachel Yuh, Sloka Chava, Sahasra Chava, Dylan Patrick Kelly, Aiden Chiang, Harsit Mittal, Sudheer Chava,
- Abstract要約: 世界中央銀行のデータセットを導入し,28年間の歴史的データをもとに25の中央銀行から380万件の文を作成した。
我々は3つのタスクを定義する:スタンス検出、時間分類、不確かさ推定。
銀行間で集約されたデータに基づいてトレーニングされたモデルは、個々の銀行のデータに基づいてトレーニングされたモデルを大幅に上回っており、「全体はその部分の総和よりも大きい」という原則を確認している。
- 参考スコア(独自算出の注目度): 3.3775007303420215
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Central banks around the world play a crucial role in maintaining economic stability. Deciphering policy implications in their communications is essential, especially as misinterpretations can disproportionately impact vulnerable populations. To address this, we introduce the World Central Banks (WCB) dataset, the most comprehensive monetary policy corpus to date, comprising over 380k sentences from 25 central banks across diverse geographic regions, spanning 28 years of historical data. After uniformly sampling 1k sentences per bank (25k total) across all available years, we annotate and review each sentence using dual annotators, disagreement resolutions, and secondary expert reviews. We define three tasks: Stance Detection, Temporal Classification, and Uncertainty Estimation, with each sentence annotated for all three. We benchmark seven Pretrained Language Models (PLMs) and nine Large Language Models (LLMs) (Zero-Shot, Few-Shot, and with annotation guide) on these tasks, running 15,075 benchmarking experiments. We find that a model trained on aggregated data across banks significantly surpasses a model trained on an individual bank's data, confirming the principle "the whole is greater than the sum of its parts." Additionally, rigorous human evaluations, error analyses, and predictive tasks validate our framework's economic utility. Our artifacts are accessible through the HuggingFace and GitHub under the CC-BY-NC-SA 4.0 license.
- Abstract(参考訳): 世界中の中央銀行は経済の安定維持に重要な役割を担っている。
特に、誤った解釈が脆弱な人口に不均等に影響を及ぼす可能性があるため、彼らのコミュニケーションにおける政策含意の解読は不可欠である。
これを解決するため,世界中央銀行(WCB)データセットを導入し,28年間にわたる歴史的データをもとに25の中央銀行から380万件以上の刑期を言い渡した。
銀行ごとの1k文(合計25k文)を全年にわたって一斉にサンプリングした後,2重アノテータ,不一致解決,二次専門家レビューを用いて各文を注釈・レビューする。
我々は3つのタスクを定義する:スタンス検出、時間分類、不確かさ推定。
我々は、これらのタスクに対して7つの事前訓練言語モデル(PLM)と9つの大言語モデル(Zero-Shot、Few-Shot、アノテーションガイド付き)をベンチマークし、15,075のベンチマーク実験を実行した。
銀行間で集約されたデータに基づいてトレーニングされたモデルは、個々の銀行のデータに基づいてトレーニングされたモデルを大幅に上回っており、「全体はその部分の総和よりも大きい」という原則を確認している。
さらに、厳密な人的評価、エラー分析、予測タスクは、我々のフレームワークの経済的有用性を検証する。
私たちのアーティファクトは、CC-BY-NC-SA 4.0ライセンスの下で、HuggingFaceとGitHubを通じてアクセスできます。
関連論文リスト
- WorldPM: Scaling Human Preference Modeling [130.23230492612214]
我々は、このスケーリングの可能性を強調するために、World Preference Modeling$ (WorldPM)を提案する。
多様なユーザコミュニティをカバーする公開フォーラムから選好データを収集する。
1.5Bから72Bパラメータの範囲で15Mスケールのデータを用いて広範囲なトレーニングを行う。
論文 参考訳(メタデータ) (2025-05-15T17:38:37Z) - Sentiment Classification of Thai Central Bank Press Releases Using Supervised Learning [0.0]
本研究では,タイ銀行からのプレスリリースの感情を分類するために,教師付き機械学習技術を適用した。
私の研究結果によると、教師あり学習はより小さなデータセットであっても効果的な手法であり、さらなる自動化の出発点となる。
論文 参考訳(メタデータ) (2025-03-28T17:20:41Z) - FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。
FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文 参考訳(メタデータ) (2025-02-26T05:19:16Z) - Analysis of the Fed's communication by using textual entailment model of
Zero-Shot classification [0.0]
我々は、テキストマイニング技術を用いて中央銀行が発行した文書を分析した。
声明のトーン、議事録、記者会見の書き起こし、米連邦準備制度理事会(FRB)の演説を比較します。
論文 参考訳(メタデータ) (2023-06-07T09:23:26Z) - Why Can't Discourse Parsing Generalize? A Thorough Investigation of the
Impact of Data Diversity [10.609715843964263]
標準的な英語ニュースワイヤベンチマークでトレーニングされた最先端アーキテクチャは、十分に一般化されていないことを示す。
学習データにおけるジャンルの多様性の影響を定量化し,テキストタイプへの一般化を実現する。
本研究は,全木におけるクロスコーパスRTT解析の一般化性を評価する最初の試みである。
論文 参考訳(メタデータ) (2023-02-13T16:11:58Z) - Retrieval-based Disentangled Representation Learning with Natural
Language Supervision [61.75109410513864]
本稿では,VDR(Vocabulary Disentangled Retrieval)を提案する。
提案手法では,両エンコーダモデルを用いて語彙空間におけるデータと自然言語の両方を表現する。
論文 参考訳(メタデータ) (2022-12-15T10:20:42Z) - Holistic Evaluation of Language Models [183.94891340168175]
言語モデル(LM)は、ほとんどすべての主要言語技術の基盤となっているが、その能力、制限、リスクはよく理解されていない。
本稿では,言語モデルの透明性を向上させるために,言語モデルの完全性評価(HELM)を提案する。
論文 参考訳(メタデータ) (2022-11-16T18:51:34Z) - Should Bank Stress Tests Be Fair? [1.370633147306388]
銀行間でデータをプールすることは銀行を平等に扱うが、2つの欠陥があると主張する。
我々は、銀行間の差異を単に無視するよりも、中心的な銀行固定効果を推定し、破棄することを好んで論じる。
論文 参考訳(メタデータ) (2022-07-27T06:46:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。