Fugu-MT 論文翻訳(概要): Words That Unite The World: A Unified Framework for Deciphering Central Bank Communications Globally

論文の概要: Words That Unite The World: A Unified Framework for Deciphering Central Bank Communications Globally

arxiv url: http://arxiv.org/abs/2505.17048v1
Date: Thu, 15 May 2025 19:49:20 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-01 23:16:01.402277
Title: Words That Unite The World: A Unified Framework for Deciphering Central Bank Communications Globally
Title（参考訳）: 世界を統合する言葉:中央銀行のコミュニケーションをグローバルに解読するための統一されたフレームワーク
Authors: Agam Shah, Siddhant Sukhani, Huzaifa Pardawala, Saketh Budideti, Riya Bhadani, Rudra Gopal, Siddhartha Somani, Michael Galarnyk, Soungmin Lee, Arnav Hiray, Akshar Ravichandran, Eric Kim, Pranav Aluru, Joshua Zhang, Sebastian Jaskowski, Veer Guda, Meghaj Tarte, Liqin Ye, Spencer Gosden, Rutwik Routu, Rachel Yuh, Sloka Chava, Sahasra Chava, Dylan Patrick Kelly, Aiden Chiang, Harsit Mittal, Sudheer Chava,
Abstract要約: 世界中央銀行のデータセットを導入し,28年間の歴史的データをもとに25の中央銀行から380万件の文を作成した。我々は3つのタスクを定義する:スタンス検出、時間分類、不確かさ推定。銀行間で集約されたデータに基づいてトレーニングされたモデルは、個々の銀行のデータに基づいてトレーニングされたモデルを大幅に上回っており、「全体はその部分の総和よりも大きい」という原則を確認している。
参考スコア（独自算出の注目度）: 3.3775007303420215
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Central banks around the world play a crucial role in maintaining economic stability. Deciphering policy implications in their communications is essential, especially as misinterpretations can disproportionately impact vulnerable populations. To address this, we introduce the World Central Banks (WCB) dataset, the most comprehensive monetary policy corpus to date, comprising over 380k sentences from 25 central banks across diverse geographic regions, spanning 28 years of historical data. After uniformly sampling 1k sentences per bank (25k total) across all available years, we annotate and review each sentence using dual annotators, disagreement resolutions, and secondary expert reviews. We define three tasks: Stance Detection, Temporal Classification, and Uncertainty Estimation, with each sentence annotated for all three. We benchmark seven Pretrained Language Models (PLMs) and nine Large Language Models (LLMs) (Zero-Shot, Few-Shot, and with annotation guide) on these tasks, running 15,075 benchmarking experiments. We find that a model trained on aggregated data across banks significantly surpasses a model trained on an individual bank's data, confirming the principle "the whole is greater than the sum of its parts." Additionally, rigorous human evaluations, error analyses, and predictive tasks validate our framework's economic utility. Our artifacts are accessible through the HuggingFace and GitHub under the CC-BY-NC-SA 4.0 license.
Abstract（参考訳）: 世界中の中央銀行は経済の安定維持に重要な役割を担っている。特に、誤った解釈が脆弱な人口に不均等に影響を及ぼす可能性があるため、彼らのコミュニケーションにおける政策含意の解読は不可欠である。これを解決するため,世界中央銀行(WCB)データセットを導入し,28年間にわたる歴史的データをもとに25の中央銀行から380万件以上の刑期を言い渡した。銀行ごとの1k文(合計25k文)を全年にわたって一斉にサンプリングした後,2重アノテータ,不一致解決,二次専門家レビューを用いて各文を注釈・レビューする。我々は3つのタスクを定義する:スタンス検出、時間分類、不確かさ推定。我々は、これらのタスクに対して7つの事前訓練言語モデル(PLM)と9つの大言語モデル(Zero-Shot、Few-Shot、アノテーションガイド付き)をベンチマークし、15,075のベンチマーク実験を実行した。銀行間で集約されたデータに基づいてトレーニングされたモデルは、個々の銀行のデータに基づいてトレーニングされたモデルを大幅に上回っており、「全体はその部分の総和よりも大きい」という原則を確認している。さらに、厳密な人的評価、エラー分析、予測タスクは、我々のフレームワークの経済的有用性を検証する。私たちのアーティファクトは、CC-BY-NC-SA 4.0ライセンスの下で、HuggingFaceとGitHubを通じてアクセスできます。

関連論文リスト

JT-Safe: Intrinsically Enhancing the Safety and Trustworthiness of LLMs [53.59414720003988]
大規模な言語モデルの不安全と幻覚は、本質的には事前学習に由来すると広く合意されている。データは広大なので、事実の誤り、論理的不整合、あるいは分布バイアスのデータを完全に浄化することはほとんど不可能です。産業シナリオを反映した大量のデータ量を増やすことを目的として, プレトレーニングデータを世界規模で拡張する手法を提案する。
論文参考訳（メタデータ） (2025-10-20T02:12:49Z)
Op-Fed: Opinion, Stance, and Monetary Policy Annotations on FOMC Transcripts Using Active Learning [3.0294344089697596]
人間の注釈付き1044文とそのコンテキストのデータセットであるOp-Fedをリリースする。我々は、意見、金融政策、金融政策に対するスタンスを分離する5段階の階層的スキーマを開発した。分析の結果,ゼロショットの精度は0.80であるが,ゼロショットの精度は0.61に過ぎなかった。
論文参考訳（メタデータ） (2025-09-16T21:07:17Z)
Can We Reliably Predict the Fed's Next Move? A Multi-Modal Approach to U.S. Monetary Policy Forecasting [2.6396287656676733]
本研究では、構造化データと連邦準備制度の通信からの非構造化テキスト信号を統合することにより、予測精度を向上させることができるかどうかを検討する。以上の結果から,ハイブリッドモデルは単調なベースラインを一貫して上回ることがわかった。金融政策予測では、より単純なハイブリッドモデルは正確性と解釈可能性の両方を提供し、研究者と意思決定者に実用的な洞察を提供する。
論文参考訳（メタデータ） (2025-06-28T05:54:58Z)
A Controllable Examination for Long-Context Language Models [62.845852724511964]
本研究では,長文言語モデルを評価するベンチマークである$textbfLongBioBenchを紹介する。その結果,ほとんどのモデルでは,検索結果に対する意味的理解や基礎的推論が不足していることが判明した。我々のさらなる分析は、文脈的非コヒーレンスなど、既存の合成ベンチマークで採用されているいくつかの設計選択を示している。
論文参考訳（メタデータ） (2025-06-03T14:23:06Z)
WorldPM: Scaling Human Preference Modeling [130.23230492612214]
我々は、このスケーリングの可能性を強調するために、World Preference Modeling$ (WorldPM)を提案する。多様なユーザコミュニティをカバーする公開フォーラムから選好データを収集する。 1.5Bから72Bパラメータの範囲で15Mスケールのデータを用いて広範囲なトレーニングを行う。
論文参考訳（メタデータ） (2025-05-15T17:38:37Z)
Sentiment Classification of Thai Central Bank Press Releases Using Supervised Learning [0.0]
本研究では,タイ銀行からのプレスリリースの感情を分類するために,教師付き機械学習技術を適用した。私の研究結果によると、教師あり学習はより小さなデータセットであっても効果的な手法であり、さらなる自動化の出発点となる。
論文参考訳（メタデータ） (2025-03-28T17:20:41Z)
FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。 FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文参考訳（メタデータ） (2025-02-26T05:19:16Z)
Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models [61.467781476005435]
集約精度を検査する際には、スキルワイドのパフォーマンスが不明確になる。モデル生成論理を検査することで,任意の評価事例に関連する基礎的スキルを復元する自動手法を提案する。私たちのスキルスライスとフレームワークは、モデル評価の新しい道を開き、スキル固有の分析を活用して、よりきめ細やかで実用的なモデル機能の理解を解き放ちます。
論文参考訳（メタデータ） (2024-10-17T17:51:40Z)
Analysis of the Fed's communication by using textual entailment model of Zero-Shot classification [0.0]
我々は、テキストマイニング技術を用いて中央銀行が発行した文書を分析した。声明のトーン、議事録、記者会見の書き起こし、米連邦準備制度理事会(FRB)の演説を比較します。
論文参考訳（メタデータ） (2023-06-07T09:23:26Z)
Why Can't Discourse Parsing Generalize? A Thorough Investigation of the Impact of Data Diversity [10.609715843964263]
標準的な英語ニュースワイヤベンチマークでトレーニングされた最先端アーキテクチャは、十分に一般化されていないことを示す。学習データにおけるジャンルの多様性の影響を定量化し,テキストタイプへの一般化を実現する。本研究は,全木におけるクロスコーパスRTT解析の一般化性を評価する最初の試みである。
論文参考訳（メタデータ） (2023-02-13T16:11:58Z)
Retrieval-based Disentangled Representation Learning with Natural Language Supervision [61.75109410513864]
本稿では,VDR(Vocabulary Disentangled Retrieval)を提案する。提案手法では,両エンコーダモデルを用いて語彙空間におけるデータと自然言語の両方を表現する。
論文参考訳（メタデータ） (2022-12-15T10:20:42Z)
Holistic Evaluation of Language Models [183.94891340168175]
言語モデル(LM)は、ほとんどすべての主要言語技術の基盤となっているが、その能力、制限、リスクはよく理解されていない。本稿では,言語モデルの透明性を向上させるために,言語モデルの完全性評価(HELM)を提案する。
論文参考訳（メタデータ） (2022-11-16T18:51:34Z)
Should Bank Stress Tests Be Fair? [1.370633147306388]
銀行間でデータをプールすることは銀行を平等に扱うが、2つの欠陥があると主張する。我々は、銀行間の差異を単に無視するよりも、中心的な銀行固定効果を推定し、破棄することを好んで論じる。
論文参考訳（メタデータ） (2022-07-27T06:46:51Z)
TextFlint: Unified Multilingual Robustness Evaluation Toolkit for Natural Language Processing [73.16475763422446]
NLPタスク(TextFlint)のための多言語ロバスト性評価プラットフォームを提案する。普遍的なテキスト変換、タスク固有の変換、敵攻撃、サブポピュレーション、およびそれらの組み合わせを取り入れ、包括的な堅牢性分析を提供する。 TextFlintは、モデルの堅牢性の欠点に対処するために、完全な分析レポートとターゲットとした拡張データを生成します。
論文参考訳（メタデータ） (2021-03-21T17:20:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。