論文の概要: Structural Enforcement of Statistical Rigor in AI-Driven Discovery: A Functional Architecture
- arxiv url: http://arxiv.org/abs/2511.06701v1
- Date: Mon, 10 Nov 2025 04:42:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.077931
- Title: Structural Enforcement of Statistical Rigor in AI-Driven Discovery: A Functional Architecture
- Title(参考訳): AI駆動ディスカバリにおける統計的リゴーの構造的強化 - 機能的アーキテクチャ
- Authors: Karen Sargsyan,
- Abstract要約: 自動研究システム(AI-サイエンティフィック)における統計厳密化のための機能的アーキテクチャを提案する。
我々は、シーケンシャルな統計プロトコルを強制するHaskell eDeclarative ControlであるResearch monadを紹介する。
大規模シミュレーションとエンドツーエンドケーススタディにより,本手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 5.076419064097734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sequential statistical protocols require meticulous state management and robust error handling -- challenges naturally suited to functional programming. We present a functional architecture for structural enforcement of statistical rigor in automated research systems (AI-Scientists). These LLM-driven systems risk generating spurious discoveries through dynamic hypothesis testing. We introduce the Research monad, a Haskell eDSL that enforces sequential statistical protocols (e.g., Online FDR (false discovery rate) control) using a monad transformer stack. To address risks in hybrid architectures where LLMs generate imperative code, we employ Declarative Scaffolding -- generating rigid harnesses that structurally constrain execution and prevent methodological errors like data leakage. We validate this approach through large-scale simulation (N=2000 hypotheses) and an end-to-end case study, demonstrating essential defense-in-depth for automated science integrity.
- Abstract(参考訳): 逐次統計プロトコルは、厳密な状態管理と堅牢なエラー処理を必要とします。
自動研究システム(AI-サイエンティフィック)における統計リガーの構造的実施のための機能的アーキテクチャを提案する。
これらのLLM駆動システムは、動的仮説テストによって急激な発見を引き起こすリスクがある。
我々は、モナドトランスフォーマースタックを使用してシーケンシャルな統計プロトコル(例えばオンラインFDR(false discovery rate)制御)を強制するHaskell eDSLであるResearch Monadを紹介した。
LLMが命令型コードを生成するハイブリッドアーキテクチャのリスクに対処するため、私たちはDeclaative Scaffoldingという、構造的に実行を制限し、データ漏洩のような方法論上のエラーを防止する、堅固なハーネスを新たに採用しています。
大規模シミュレーション(N=2000仮説)とエンドツーエンドのケーススタディにより,このアプローチを検証し,自動科学の完全性に不可欠な防御効果を示す。
関連論文リスト
- AutoML in Cybersecurity: An Empirical Study [0.8703011045028926]
本稿では,11の公開サイバーセキュリティデータセットを対象とした8つのオープンソースAutoMLフレームワークを体系的に評価する。
結果は、ツールやデータセット間での大幅なパフォーマンスの変動を示しており、一貫して優れたソリューションは存在しない。
主な課題は、敵の脆弱性、モデルドリフト、不適切な機能エンジニアリングである。
論文 参考訳(メタデータ) (2025-09-28T03:52:46Z) - Constrained Decoding for Robotics Foundation Models [12.916330118607918]
本稿では,自動回帰ロボット基盤モデルのための制約付き復号化フレームワークであるSafeDecを紹介する。
タスク固有の安全ルールはSignal Temporal Logic (STL) 公式として表現され、最小限のオーバーヘッドで推論時に強制される。
提案手法は,実行時に仮定された動的条件下でのSTL仕様を,再トレーニングなしで確実に満たすものである。
論文 参考訳(メタデータ) (2025-09-01T19:17:40Z) - Autonomous Control Leveraging LLMs: An Agentic Framework for Next-Generation Industrial Automation [0.0]
本稿では,大規模言語モデル(LLM)を個別のフォールトリカバリ計画と継続的プロセス制御の両方に活用する統合エージェントフレームワークを提案する。
その結果、構造化されたフィードバックとモジュラーエージェントにより、LLMは高レベルな記号計画と低レベルな連続制御を統一できることを示した。
論文 参考訳(メタデータ) (2025-07-03T11:20:22Z) - Self-Steering Language Models [113.96916935955842]
DisCIPL は "self-steering" 言語モデル (LM) の手法である。
DisCIPLは、Followerモデルの集団によって実行されるタスク固有の推論プログラムを生成する。
我々の研究は、高度に並列化されたモンテカルロ推論戦略の設計空間を開く。
論文 参考訳(メタデータ) (2025-04-09T17:54:22Z) - ZeroLM: Data-Free Transformer Architecture Search for Language Models [54.83882149157548]
現在の自動プロキシ発見アプローチは、検索時間の拡張、データの過度なオーバーフィットへの感受性、構造的な複雑さに悩まされている。
本稿では,効率的な重み統計によるモデルキャパシティの定量化を目的とした,新しいゼロコストプロキシ手法を提案する。
本評価は,FlexiBERT ベンチマークで Spearman's rho 0.76 と Kendall's tau 0.53 を達成し,このアプローチの優位性を示すものである。
論文 参考訳(メタデータ) (2025-03-24T13:11:22Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - The Power of Resets in Online Reinforcement Learning [73.64852266145387]
ローカルシミュレータアクセス(あるいはローカルプランニング)を用いたオンライン強化学習を通してシミュレータのパワーを探求する。
カバー性が低いMPPは,Qstar$-realizabilityのみのサンプル効率で学習可能であることを示す。
ローカルシミュレーターアクセス下では, 悪名高いExogenous Block MDP問題が抽出可能であることを示す。
論文 参考訳(メタデータ) (2024-04-23T18:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。