論文の概要: Is attention truly all we need? An empirical study of asset pricing in pretrained RNN sparse and global attention models
- arxiv url: http://arxiv.org/abs/2508.19006v1
- Date: Tue, 26 Aug 2025 13:04:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.849982
- Title: Is attention truly all we need? An empirical study of asset pricing in pretrained RNN sparse and global attention models
- Title(参考訳): 注意は本当に必要か? 事前訓練されたRNNスパースとグローバルアテンションモデルにおける資産価格に関する実証的研究
- Authors: Shanyan Lai,
- Abstract要約: 本研究では,付加的注意,Luongの3つの注意,グローバル自己注意(Self-att),スライディングウィンドウスパース注意(Sparse-att)などの主要な注意機構を有するRNN注意モデルについて検討する。
資産価格の文脈で適用された大規模なSOTA(State-of-the-art attention mechanism)に関する最初の論文である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study investigates the pretrained RNN attention models with the mainstream attention mechanisms such as additive attention, Luong's three attentions, global self-attention (Self-att) and sliding window sparse attention (Sparse-att) for the empirical asset pricing research on top 420 large-cap US stocks. This is the first paper on the large-scale state-of-the-art (SOTA) attention mechanisms applied in the asset pricing context. They overcome the limitations of the traditional machine learning (ML) based asset pricing, such as mis-capturing the temporal dependency and short memory. Moreover, the enforced causal masks in the attention mechanisms address the future data leaking issue ignored by the more advanced attention-based models, such as the classic Transformer. The proposed attention models also consider the temporal sparsity characteristic of asset pricing data and mitigate potential overfitting issues by deploying the simplified model structures. This provides some insights for future empirical economic research. All models are examined in three periods, which cover pre-COVID-19 (mild uptrend), COVID-19 (steep uptrend with a large drawdown) and one year post-COVID-19 (sideways movement with high fluctuations), for testing the stability of these models under extreme market conditions. The study finds that in value-weighted portfolio back testing, Model Self-att and Model Sparse-att exhibit great capabilities in deriving the absolute returns and hedging downside risks, while they achieve an annualized Sortino ratio of 2.0 and 1.80 respectively in the period with COVID-19. And Model Sparse-att performs more stably than Model Self-att from the perspective of absolute portfolio returns with respect to the size of stocks' market capitalization.
- Abstract(参考訳): 本研究は,Luong氏の3つの注意,グローバル自己注意(Self-att),スライディングウィンドウスパース(Sparse-att)といった,付加的注意力,付加的注意力,Luong氏の3つの注意力,および米国株式420銘柄に対する実証的資産価格調査などの主要な注意力メカニズムを備えた,事前訓練されたRNNアテンションモデルについて検討する。
本論文は、資産価格の文脈に適用される大規模なSOTA(State-of-the-art attention mechanism)に関する最初の論文である。
従来の機械学習(ML)ベースのアセット価格の制限を克服する。
さらに、アテンション機構における強制因果マスクは、従来のトランスフォーマーのようなより高度なアテンションベースモデルによって無視される将来のデータ漏洩問題に対処する。
提案モデルはまた、資産価格データの時間的空間特性を考慮し、単純化されたモデル構造を配置することで潜在的な過適合問題を緩和する。
これは将来の経験的経済研究にいくつかの洞察を与える。
すべてのモデルは、3つの期間で検査され、その期間は、新型コロナウイルス前(ミルドアップトレンド)、COVID-19後(大きなダウンダウン)、そして1年間は、非常に市場の状況下でこれらのモデルの安定性をテストする。
調査によると、価値重み付きポートフォリオバックテストでは、Model Self-attとModel Sparse-attは、絶対的なリターンを導き、ダウンサイドのリスクをヘッジする上で優れた能力を示し、一方、新型コロナウイルス(COVID-19)の期間にそれぞれ2.0と1.80のSortino比を達成している。
Model Sparse-attは、絶対ポートフォリオリターンの観点から、株式の市場資本化の大きさの観点から、Model Self-attよりも安定して機能します。
関連論文リスト
- Holmes: Towards Effective and Harmless Model Ownership Verification to Personalized Large Vision Models via Decoupling Common Features [54.63343151319368]
本稿では、類似の共通特徴を分離し、パーソナライズされたモデルに対する無害モデルオーナシップ検証手法を提案する。
最初の段階では、データセット固有の機能を中断しながら、犠牲者モデルの共通の特徴を保持するシャドウモデルを作成します。
その後、メタ分類器が訓練され、被害者のデータセット固有の特徴を含む不審なモデルを決定することで、盗まれたモデルを特定する。
論文 参考訳(メタデータ) (2025-06-24T15:40:11Z) - Pursuing Top Growth with Novel Loss Function [0.5312311916594153]
我々は、トップ成長を促進するリターン重み付き損失関数を導入することで、AIのポテンシャルとユーティリティをさらに強化することを目指している。
当社のベストモデルでは、2019年から2024年までの1340回のテスト日において、毎年1.18パーセントのシャープ比率で、毎日のリバランスで61.73%のリターンを達成しています。
また, 従来の損失関数よりも, いくつかの性能指標と統計的証拠により, 新たな損失関数の優位性を示す。
論文 参考訳(メタデータ) (2025-02-20T21:43:51Z) - STORM: A Spatio-Temporal Factor Model Based on Dual Vector Quantized Variational Autoencoders for Financial Trading [55.02735046724146]
金融取引では、ファクターモデルが資産の価格設定や過大なリターンの獲得に広く利用されている。
双対ベクトル量子化変分オートエンコーダを用いた時空間ファクトラーモデルSTORMを提案する。
ストームは時間的および空間的な視点からストックの特徴を抽出し、これらの特徴を微細で意味的なレベルで融合し整列させ、その要素を多次元の埋め込みとして表現する。
論文 参考訳(メタデータ) (2024-12-12T17:15:49Z) - Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文 参考訳(メタデータ) (2024-11-30T10:56:30Z) - KAN based Autoencoders for Factor Models [13.512750745176664]
Kolmogorov-Arnold Networks (KANs) の最近の進歩に触発されて、潜在因子条件付き資産価格モデルに新しいアプローチを導入する。
提案手法では,精度と解釈性の両方でモデルを超えるkanベースのオートエンコーダを提案する。
提案モデルは,資産特性の非線形機能として露出を近似する際の柔軟性を向上するとともに,潜在要因を解釈するための直感的なフレームワークをユーザに提供する。
論文 参考訳(メタデータ) (2024-08-04T02:02:09Z) - CausalAgents: A Robustness Benchmark for Motion Forecasting using Causal
Relationships [8.679073301435265]
既存のデータに摂動を適用することにより、モデルロバスト性の評価と改善のための新しいベンチマークを構築する。
我々はこれらのラベルを使用して、現場から非因果的エージェントを削除することでデータを摂動する。
非因果摂動下では, minADE の相対的な変化は, 原型と比較して25$-$38%である。
論文 参考訳(メタデータ) (2022-07-07T21:28:23Z) - A transformer-based model for default prediction in mid-cap corporate
markets [13.535770763481905]
時価総額が100億ドル未満の中堅企業について調査する。
中間項の既定確率項構造を予測することを目的とする。
私たちは、どのデータソースがデフォルトのリスクに最も貢献しているかを理解しています。
論文 参考訳(メタデータ) (2021-11-18T19:01:00Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。