論文の概要: Hubble: An LLM-Driven Agentic Framework for Safe, Diverse, and Reproducible Alpha Factor Discovery
- arxiv url: http://arxiv.org/abs/2604.09601v2
- Date: Tue, 14 Apr 2026 05:41:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.539806
- Title: Hubble: An LLM-Driven Agentic Framework for Safe, Diverse, and Reproducible Alpha Factor Discovery
- Title(参考訳): Hubble: 安全、多様性、再現可能なアルファ因子発見のためのLLM駆動のエージェントフレームワーク
- Authors: Runze Shi, Shengyu Yan, Yuecheng Cai, Chengxi Lv,
- Abstract要約: 本稿では,大規模言語モデル(LLM)とドメイン固有の演算子言語を組み合わせたエージェントファクタマイニングフレームワークであるHumbbleを紹介する。
約500株の米国株式の世界において、当社のメインランは、実行時クラッシュゼロの3ラウンドで104人の有効な候補を評価しています。
次に、上位5因子を修正し、2025-06-01から2026-03-13までの保留期間で検証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated alpha discovery is difficult because the search space of formulaic factors is combinatorial, the signal-to-noise ratio in daily equity data is low, and unconstrained program generation is operationally unsafe. We present Hubble, an agentic factor mining framework that combines large language models (LLMs) with a domain-specific operator language, an abstract syntax tree (AST) execution sandbox, a dual-channel retrieval-augmented generation (RAG) module, and a family-aware selection mechanism. Instead of treating the LLM as an unconstrained code generator, Hubble restricts generation to interpretable operator trees, evaluates every candidate through a deterministic cross-sectional pipeline, and feeds back both top formulas and structured family-level diagnostics to subsequent rounds. The current system additionally introduces positive/negative RAG, formula-similarity penalties, standardized multi-metric scoring, dual reporting of RankIC and Pearson IC, and persistent diagnostics artifacts for post-hoc research analysis. On a U.S. equity universe of roughly 500 stocks, our main run evaluates 104 valid candidates across three rounds with zero runtime crashes and discovers a top set dominated by range, volatility, and trend families rather than crowded volume-only motifs. We then fix the resulting top-5 factors and validate them on a held-out period from 2025-06-01 to 2026-03-13. In this out-of-sample window, the two range factors and two volatility factors remain positive and several achieve HAC-significant Pearson IC and long-short evidence, whereas the weakest in-sample trend factor decays materially. These results suggest that safe LLM-guided search can be upgraded from a syntax-compliant generator into a reproducible alpha-research workflow that jointly optimizes validity, diversity, interpretability, and family-level generalization.
- Abstract(参考訳): 定式化因子の探索空間が組み合わさり、日々の株式データの信号対雑音比が低く、制約のないプログラム生成が運用上安全でないため、自動アルファ発見は困難である。
本稿では,大規模言語モデル (LLM) とドメイン固有の演算子言語,抽象構文木 (AST) 実行サンドボックス,二重チャネル検索拡張生成 (RAG) モジュール,家族認識選択機構を組み合わせたエージェントファクタマイニングフレームワークであるHumbbleを紹介する。
LLMを制約のないコードジェネレータとして扱う代わりに、ハッブルは生成を解釈可能な演算木に制限し、決定論的断面パイプラインを通じてすべての候補を評価し、上位式と構造化された家族レベルの診断をその後のラウンドに戻す。
このシステムには、正負のRAG、式相似罰則、標準化されたマルチメトリックスコア、RandICとPearson ICの二重報告、およびポストホック研究分析のための永続的な診断アーティファクトが導入されている。
約500株の米国株式の世界において、当社のメインランは、実行時のクラッシュがゼロの3ラウンドで、104の有効な候補を評価し、混み合ったボリュームのみのモチーフではなく、範囲、ボラティリティ、トレンドファミリに支配されるトップセットを発見した。
次に、上位5因子を修正し、2025-06-01から2026-03-13までの保留期間で検証する。
このアウト・オブ・サンプルウィンドウでは、2つの範囲因子と2つのボラティリティ因子が正であり、いくつかのHACに代表されるピアソンICとロングショートな証拠が得られたが、最も弱いイン・サンプルトレンド因子は物質的に崩壊する。
これらの結果から, 安全なLLM誘導探索は, 構文に適合したジェネレータから, 妥当性, 多様性, 解釈可能性, 家族レベルの一般化を共同で最適化する再現可能なアルファ検索ワークフローにアップグレード可能であることが示唆された。
関連論文リスト
- BROTHER: Behavioral Recognition Optimized Through Heterogeneous Ensemble Regularization for Ambivalence and Hesitancy [39.407739937584104]
自然主義的なビデオ設定におけるA/H(Ambivalence and Hesitancy)は、感情コンピューティングにおいて重要な課題である。
ビデオレベルでのA/H予測のために,高度に正規化されたマルチモーダル融合パイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-15T12:53:41Z) - Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions [51.22818149833102]
マルチエージェント強化学習(MARL)は、車間通信(C-V2X)ネットワークにおける無線リソース割り当ての有望なアプローチとして登場した。
しかし、MARLに固有の多面的課題はしばしば絡み合っており、車載環境における個々の影響を理解することは困難である。
我々は, C-V2X RRA を, 複雑さが徐々に増大する多エージェント干渉ゲーム列として定式化し, このギャップを埋める。
論文 参考訳(メタデータ) (2026-02-18T14:46:56Z) - Principled RL for Diffusion LLMs Emerges from a Sequence-Level Perspective [85.06838178922791]
強化学習(RL)は自己回帰言語モデルに非常に効果的であることが証明されている。
しかし、これらの手法を拡散大言語モデル(dLLM)に適応させることは、根本的な課題を提起する。
本稿では,全シーケンス生成を単一アクションとして扱い,ELBOを抽出可能なシークエンスレベル確率プロキシとして利用する,原則的RLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-03T13:05:32Z) - Dynamic Stability of LLM-Generated Code [6.120340803716395]
コード生成のためのLLMの現在の評価は、関数的に正しい解がアルゴリズムの複雑さにおいて著しく異なるという事実を見落としている。
本稿では,生成コードの動的安定性を評価するためのフレームワークを提案する。
コード生成における安定性を意識した目標と、堅牢で現実的な評価のためのテストケースを備えた新しいベンチマークが求められた。
論文 参考訳(メタデータ) (2025-11-07T09:58:06Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Agent4FaceForgery: Multi-Agent LLM Framework for Realistic Face Forgery Detection [108.5042835056188]
この作業では,2つの基本的な問題に対処するため,Agent4FaceForgeryを導入している。
人間の偽造の多様な意図と反復的なプロセスを捉える方法。
ソーシャルメディアの偽造に付随する複雑な、しばしば敵対的な、テキストと画像のインタラクションをモデル化する方法。
論文 参考訳(メタデータ) (2025-09-16T01:05:01Z) - EVALOOOP: A Self-Consistency-Centered Framework for Assessing Large Language Model Robustness in Programming [8.52533297070733]
EVALOOOPは自己整合性の観点から堅牢性を評価するアセスメントフレームワークである。
MBPP Plusベンチマークで96の人気のある大言語モデル(LLM)を評価した。
EVALOOOPは10ループでパス@1の精度を2.65%-47.62%低下させる。
論文 参考訳(メタデータ) (2025-05-18T01:02:33Z) - Semantic-Aware Contrastive Fine-Tuning: Boosting Multimodal Malware Classification with Discriminative Embeddings [2.1874189959020427]
大規模言語モデル(LLM)は、家族分類を支援するマルウェア記述を生成する可能性を提供する。
硬質負試料のターゲット選択によりLCM埋め込みを改良するコントラスト微調整法(CFT)を提案する。
提案手法は, 高い相似性陰性度を組み合わせ, 識別力と中層性陰性度を高め, 埋め込み多様性を高める。
論文 参考訳(メタデータ) (2025-04-25T02:41:45Z) - Benchmarking Large Language Models in Retrieval-Augmented Generation [53.504471079548]
大規模言語モデルに対する検索拡張生成の影響を系統的に検討する。
我々は、RAGに必要な4つの基本能力で、異なる大規模言語モデルの性能を解析する。
RGB(Retrieval-Augmented Generation Benchmark)は、英語と中国語の両方でRAG評価を行うための新しいコーパスである。
論文 参考訳(メタデータ) (2023-09-04T08:28:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。