論文の概要: Interpretable Hypothesis-Driven Trading:A Rigorous Walk-Forward Validation Framework for Market Microstructure Signals
- arxiv url: http://arxiv.org/abs/2512.12924v1
- Date: Mon, 15 Dec 2025 02:20:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.506433
- Title: Interpretable Hypothesis-Driven Trading:A Rigorous Walk-Forward Validation Framework for Market Microstructure Signals
- Title(参考訳): 解釈可能な仮説駆動取引:市場構造信号のための厳密なウォークフォワード検証フレームワーク
- Authors: Gagan Deep, Akash Deep, William Lamptey,
- Abstract要約: 我々は,アルゴリズム取引のためのウォークフォワード・バリデーション・フレームワークを開発した。
我々の手法は、解釈可能な仮説駆動信号生成と強化学習と厳密なサンプル外テストを組み合わせる。
このフレームワークは厳密な情報セットの規律を強制し、34の独立したテスト期間にわたるロールウインドウ検証を採用し、自然言語の仮説による完全な解釈可能性を維持している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop a rigorous walk-forward validation framework for algorithmic trading designed to mitigate overfitting and lookahead bias. Our methodology combines interpretable hypothesis-driven signal generation with reinforcement learning and strict out-of-sample testing. The framework enforces strict information set discipline, employs rolling window validation across 34 independent test periods, maintains complete interpretability through natural language hypothesis explanations, and incorporates realistic transaction costs and position constraints. Validating five market microstructure patterns across 100 US equities from 2015 to 2024, the system yields modest annualized returns (0.55%, Sharpe ratio 0.33) with exceptional downside protection (maximum drawdown -2.76%) and market-neutral characteristics (beta = 0.058). Performance exhibits strong regime dependence, generating positive returns during high-volatility periods (0.60% quarterly, 2020-2024) while underperforming in stable markets (-0.16%, 2015-2019). We report statistically insignificant aggregate results (p-value 0.34) to demonstrate a reproducible, honest validation protocol that prioritizes interpretability and extends naturally to advanced hypothesis generators, including large language models. The key empirical finding reveals that daily OHLCV-based microstructure signals require elevated information arrival and trading activity to function effectively. The framework provides complete mathematical specifications and open-source implementation, establishing a template for rigorous trading system evaluation that addresses the reproducibility crisis in quantitative finance research. For researchers, practitioners, and regulators, this work demonstrates that interpretable algorithmic trading strategies can be rigorously validated without sacrificing transparency or regulatory compliance.
- Abstract(参考訳): 我々は、過度なフィットとルックアヘッドバイアスを軽減するために設計されたアルゴリズム取引のための厳格なウォークフォワード検証フレームワークを開発する。
我々の手法は、解釈可能な仮説駆動信号生成と強化学習と厳密なサンプル外テストを組み合わせる。
このフレームワークは厳密な情報セットの規律を実行し、34の独立したテスト期間にわたるロールウインドウ検証を採用し、自然言語の仮説説明を通じて完全な解釈可能性を維持し、現実的なトランザクションコストと位置制約を取り入れている。
2015年から2024年までの100米国株の5つの市場マイクロ構造パターンを検証すると、このシステムは、例外的な下限保護(最大減少率-2.76%)と市場中立特性(ベータ=0.058)で、最も緩やかな年率リターン(0.55%、シャープ比0.33)が得られる。
高ボラティリティ期間(2020-2024年第0.60%、2020-2024年第0.60%)では、安定した市場(-0.16%、2015-2019年)ではパフォーマンスが低下する。
統計的に重要でない集合結果(p値0.34)を報告し、再現性のある、正直な検証プロトコルを示し、解釈可能性を重視し、大きな言語モデルを含む高度な仮説生成に自然に拡張する。
鍵となる経験的発見は、毎日のOHLCVベースの微細構造信号は、効果的に機能するために情報到着と取引活動の増大を必要とすることを示している。
このフレームワークは完全な数学的仕様とオープンソース実装を提供し、量的金融研究における再現性危機に対処する厳密な取引システム評価のテンプレートを確立する。
研究者、専門家、規制当局にとって、この研究は、透明性や規制遵守を犠牲にすることなく、解釈可能なアルゴリズム取引戦略を厳格に検証できることを示した。
関連論文リスト
- The GT-Score: A Robust Objective Function for Reducing Overfitting in Data-Driven Trading Strategies [51.56484100374058]
GT-Scoreは、パフォーマンス、統計的重要性、一貫性、ダウンサイドリスクを統合する複合目的関数である。
GT-Scoreは、歩行前向きの検証において、ベースライン目的関数に対して、一般化比を98%改善する。
これらの結果から, 抗オーバーフィッティング構造を組み込むことにより, 定量的研究におけるバックテストの信頼性を向上させることが示唆された。
論文 参考訳(メタデータ) (2026-01-22T05:16:47Z) - Replayable Financial Agents: A Determinism-Faithfulness Assurance Harness for Tool-Using LLM Agents [0.7699235580548228]
LLMエージェントは、規制監査のリプレイに苦労する: トランザクションフラグ付き決定を同じ入力で再現するように要求された場合、ほとんどのデプロイメントは一貫性のある結果を返すことができません。
本稿では,金融サービスに展開するツール利用エージェントにおけるトラジェクティブ決定性およびエビデンス条件の忠実度を測定するためのフレームワークであるDFAHを紹介する。
論文 参考訳(メタデータ) (2026-01-17T19:47:55Z) - All That Glisters Is Not Gold: A Benchmark for Reference-Free Counterfactual Financial Misinformation Detection [67.89888669159899]
RFC Benchは、現実的なニュースの下で財務的な誤情報に関する大規模な言語モデルを評価するためのベンチマークである。
このベンチマークでは、2つの補完的なタスクが定義されている。
論文 参考訳(メタデータ) (2026-01-07T18:18:28Z) - Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving [65.02106674311908]
本稿では,マルチラウンド階層的推論を行う長期水平数学エージェントであるIntern-S1-MOを紹介する。
コンパクトメモリをレムマの形で維持することにより、Intern-S1-MOはレムマリッチ推論空間をより自由に探索することができる。
実験の結果、インターンS1-MOはIMO2025の非幾何学的問題で35点中26点を得ることができ、銀メダリストのパフォーマンスに匹敵することがわかった。
論文 参考訳(メタデータ) (2025-12-11T15:26:28Z) - Inferring Latent Market Forces: Evaluating LLM Detection of Gamma Exposure Patterns via Obfuscation Testing [0.0937899315060426]
S&P500のオプションデータのうち、242日間(95.6%)で3つのディーラーが制約パターンをテストしている。
LLMは、生のガンマ露光値のみを提供するアンバイアスドプロンプトを用いて、71.5%の検知率を達成する。
論文 参考訳(メタデータ) (2025-12-08T15:48:57Z) - Bayesian Modeling for Uncertainty Management in Financial Risk Forecasting and Compliance [0.0]
我々は,市場ボラティリティ予測,不正検出,コンプライアンス監視におけるリスクの取り扱いを継続的に促進する統合的アプローチを開発する。
我々は,2000年から2019年までのトレーニング期間,2020年から2024年までのアウト・オブ・サンプルテスト期間を用いて,毎日のS&P500リターンにおける95%バリュー・アット・リスク(VaR)予測の性能を評価した。
提案した割引係数DLMモデルは,クラスタ化違反の証拠とともに,わずかにリベラルなVaR推定を導出する。
論文 参考訳(メタデータ) (2025-12-06T23:00:19Z) - FinCARE: Financial Causal Analysis with Reasoning and Evidence [39.146761527401424]
Portfolioのマネージャは相関に基づく分析と、パフォーマンスを駆動する真の因果関係のキャプチャに失敗する手法に依存している。
本稿では,SEC 10-K の申請書から抽出した財務知識グラフと大規模言語モデル推論の2つの相補的な情報源から,統計的因果探索アルゴリズムとドメイン知識を統合するハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-23T05:14:28Z) - Confidence-Based Response Abstinence: Improving LLM Trustworthiness via Activation-Based Uncertainty Estimation [7.3923284353934875]
本稿では,大規模言語モデル(LLM)出力の正しさと密接に一致したRAGシステムにおける信頼度推定手法を提案する。
提案手法は、生のフィードフォワードネットワーク(FFN)を自己回帰信号として活用することにより、事前の不確実性定量化手法を拡張した。
我々の結果は、アクティベーションに基づく信頼度モデリングが、信頼性の高いRAGデプロイメントへのスケーラブルでアーキテクチャを意識したパスを提供することを示した。
論文 参考訳(メタデータ) (2025-10-15T16:55:56Z) - Formal Models and Convergence Analysis for Context-Aware Security Verification [0.0]
本稿では,ML強化適応システムに対する証明可能な保証を確立する,文脈認識型セキュリティ検証のための公式なフレームワークを提案する。
1)適応的検証が成功した場合のサンプル複雑性境界,(2)コンテキストリッチネスと検出能力に関する情報理論制限,(3)MLベースのペイロードジェネレータの収束保証。
論文 参考訳(メタデータ) (2025-10-14T12:21:36Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Mind the Generation Process: Fine-Grained Confidence Estimation During LLM Generation [63.49409574310576]
大規模言語モデル(LLM)は自信過剰を示し、信頼度の高いスコアを誤った予測に割り当てる。
本研究では,テキスト生成中に高精度できめ細かな信頼スコアを提供する信頼度推定手法であるFineCEを紹介する。
論文で使用されたコードとすべてのベースラインはGitHubで公開されている。
論文 参考訳(メタデータ) (2025-08-16T13:29:35Z) - LLMEval-3: A Large-Scale Longitudinal Study on Robust and Fair Evaluation of Large Language Models [51.55869466207234]
静的ベンチマークにおけるLLM(Large Language Models)の既存の評価は、データの汚染やリーダーボードのオーバーフィッティングに弱い。
LLMの動的評価のためのフレームワークであるLLMEval-3を紹介する。
LLEval-3は、220kの卒業生レベルの質問からなるプロプライエタリなバンク上に構築されており、評価実行毎に未確認のテストセットを動的にサンプリングする。
論文 参考訳(メタデータ) (2025-08-07T14:46:30Z) - Predicting Liquidity-Aware Bond Yields using Causal GANs and Deep Reinforcement Learning with LLM Evaluation [0.0]
我々は4つの主要結合カテゴリ(AAA、BAA、US10Y)の高忠実な合成結合収率データを生成する。
我々は、取引信号、リスク評価、ボラティリティ予測を生成する微調整されたLarge Language Model (LLM) Qwen2.5-7Bを採用している。
強化学習による合成データ生成は、平均絶対誤差が0.103に達し、実世界の債券市場のダイナミクスを複製する効果を実証する。
論文 参考訳(メタデータ) (2025-02-24T09:46:37Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。