Fugu-MT 論文翻訳(概要): MacroLens: A Multi-Task Benchmark for Contextual Financial Reasoning under Macroeconomic Scenarios

論文の概要: MacroLens: A Multi-Task Benchmark for Contextual Financial Reasoning under Macroeconomic Scenarios

arxiv url: http://arxiv.org/abs/2606.24950v1
Date: Tue, 23 Jun 2026 07:52:44 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-25 17:05:30.066727
Title: MacroLens: A Multi-Task Benchmark for Contextual Financial Reasoning under Macroeconomic Scenarios
Title（参考訳）: MacroLens: マクロ経済シナリオ下でのコンテキストファイナンシャル推論のためのマルチタスクベンチマーク
Authors: Patara Trirat, Jin Myung Kwak, Jay Heo, Heejun Lee, Sung Ju Hwang,
Abstract要約: マクロレンズはアメリカでは4,416個の小口径スプリットとマイクロキャップ勾配スプリットをカバーしている。 7つのタスクがポイント・イン・タイムの価格表を共有しており、会計事実に関する46.8M株、53件のマクロ経済シリーズ、295,860件のSEC書類、215,882件のニュース記事がある。タスクは、コンテキスト予測、パブリックとプライベートのバリュエーション、基本と記述からのステート生成、シナリオ条件のリターン、および不動産のバリュエーションにまたがる。
参考スコア（独自算出の注目度）: 44.59910717749994
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Financial decision-making is contextual: forecasting prices, valuing companies, and assessing event exposure weigh price history, accounting fundamentals, macroeconomic regime, and contemporaneous text. A benchmark over these four signals is hard to build because finance violates four assumptions of time-series evaluation: text must be gated by its publication date to prevent look-ahead, quarterly fundamentals are reported with a one- to ninety-day lag, filing text is partly redundant with the numerical statement fields it accompanies, and macroeconomic regimes leak across calendar splits. No public benchmark addresses all four signals jointly. MacroLens covers 4,416 U.S. small- and micro-cap equities over 2021-2026. Seven tasks share one point-in-time panel of prices, 46.8M XBRL accounting facts, 53 macroeconomic series, 295,860 SEC filings, and 215,882 news articles, plus a scenario layer of 1,130 macroeconomic events across 49 types automatically detected and rendered as natural language. Tasks span contextual forecasting, public and private valuation, statement generation from fundamentals and descriptions, scenario-conditioned returns, and real-estate valuation. We evaluate 19 methods across six families spanning naive heuristics through time-series foundation models, fine-tuned LLM-based time-series models, and zero-shot large language models (LLMs), plus a five-step feature-context ablation on two frontier LLMs and a gradient-boosted baseline. MacroLens is released at https://huggingface.co/datasets/DeepAuto-AI/MacroLens.
Abstract（参考訳）: 価格を予測し、会社を評価し、イベントの露光を評価することは、価格の歴史を重くし、基礎、マクロ経済体制、そして同時期のテキストを会計する。これらの4つの信号に対するベンチマークは、金融が時系列評価の4つの前提に違反しているため、構築が困難である。共同で4つの信号に対処する公開ベンチマークはない。マクロレンスは2021年から2026年の間に4,416米国中小の株式を保有している。 7つのタスクが1つのポイント・イン・タイムの価格表を共有しており、46.8MのXBRL会計事実、53のマクロ経済シリーズ、295,860のSEC書類、215,882のニュース記事、49種類のマクロ経済イベントが自動的に検出され、自然言語として表現されるシナリオ層がある。タスクは、コンテキスト予測、パブリックとプライベートのバリュエーション、基本と記述からのステート生成、シナリオ条件のリターン、および不動産のバリュエーションにまたがる。時系列基礎モデル、微調整LDMに基づく時系列モデル、ゼロショット大言語モデル(LLM)、および2つのフロンティアLDMと勾配ブーストベースラインの5段階の特徴テキストアブレーションを用いて、ナイーブヒューリスティックスにまたがる19の手法を評価した。 MacroLensはhttps://huggingface.co/datasets/DeepAuto-AI/MacroLensでリリースされた。

関連論文リスト

Nexus : An Agentic Framework for Time Series Forecasting [72.73790673303154]
時系列予測は、ニュースやイベントのような構造化されていないコンテキストデータによる推論を必要とする。予測を特殊なステージに分解するマルチエージェント予測フレームワークであるNexusを紹介します。本研究では,現在のLLMは,従来よりも強い固有予測能力を有することを示す。
論文参考訳（メタデータ） (2026-05-14T05:12:13Z)
PolyBench: Benchmarking LLM Forecasting and Trading Capabilities on Live Prediction Market Data [3.7753883100108525]
textbfPolyBenchは、生の市場信号から現実世界のイベントを予測するためのベンチマークである。ポリベンチを用いて、7つの最先端の大規模言語モデルを評価する。本フレームワークは, 方向性の精度, 信頼性-重み付きリターン(CWR), 年次パーセンテージ収率(APY), シャープ比を評価する。
論文参考訳（メタデータ） (2026-04-03T06:25:21Z)
QuitoBench: A High-Quality Open Time Series Forecasting Benchmark [32.21290355342465]
時系列予測は、ファイナンス、ヘルスケア、クラウドコンピューティングにおいて重要である。時系列予測のための状態バランスのベンチマークであるtextscQuitoBenchを紹介する。
論文参考訳（メタデータ） (2026-03-27T02:24:34Z)
History Rhymes: Macro-Contextual Retrieval for Robust Financial Forecasting [1.8911049192403768]
我々は、歴史的に類似したマクロ経済体制において、各予測を基礎づける検索強化予測フレームワークであるマクロコンテキスト検索を導入する。 AAPL (2024) と XOM (2024) の17年間のS&P 500データ(2007-2023) をトレーニングし, CV と OOD のパフォーマンスギャップを一貫して狭めている。金融史は繰り返しではなく、しばしば韻律である」という原則を運用することにより、マクロ認識検索が分布変化の下で頑健で説明可能な予測をもたらすことを示す。
論文参考訳（メタデータ） (2025-11-12T21:34:23Z)
MultiFinBen: Benchmarking Large Language Models for Multilingual and Multimodal Financial Application [118.63802040274999]
MultiFinBen は、現実的な財務状況下で LLM を評価するための、最初のエキスパートアノテーション付き多言語(5言語)およびマルチモーダルベンチマークである。財務理由付けテストは、書類やニュースと統合された言語間のエビデンスと、スキャンされた文書から構造化されたテキストを抽出する財務OCRである。 21個のLLMを評価したところ、GPT-4oのようなフロンティアのマルチモーダルモデルでさえ、視力とオーディオが強く、多言語設定では急激に低下するが、全体の46.01%しか達成していないことが示されている。
論文参考訳（メタデータ） (2025-06-16T22:01:49Z)
Open-FinLLMs: Open Multimodal Large Language Models for Financial Applications [88.96861155804935]
オープンソースのマルチモーダル金融 LLM である textitOpen-FinLLMs を紹介する。 FinLLaMAは52ビリオンのトーケンコーパス、FinLLaMA-Instructは573Kの財務命令で微調整され、FinLLaVAは1.43Mのマルチモーダルチューニングペアで強化されている。我々は、14の財務タスク、30のデータセット、および4つのマルチモーダルタスクにわたるOpen-FinLLMをゼロショット、少数ショット、教師付き微調整設定で評価した。
論文参考訳（メタデータ） (2024-08-20T16:15:28Z)
Macroeconomic Forecasting with Large Language Models [2.5234156040689233]
本稿では,従来のマクロ時系列予測手法と比較して,Large Language Models(LLM)の精度を評価する。本研究は, LLMの長所と短所について, 実世界のシナリオにおける適用性に光を当てながら, マクロ経済時系列の予測における長所と短所について, 貴重な知見を提供するものである。
論文参考訳（メタデータ） (2024-07-01T01:25:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。