論文の概要: NOVA: Fundamental Limits of Knowledge Discovery Through AI
- arxiv url: http://arxiv.org/abs/2605.15219v1
- Date: Tue, 12 May 2026 21:37:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.010338
- Title: NOVA: Fundamental Limits of Knowledge Discovery Through AI
- Title(参考訳): NOVA:AIによる知識発見の基本的限界
- Authors: Salman Avestimehr, Ken Duffy, Muriel Médard,
- Abstract要約: 本研究では,共通生成,検証,蓄積,再学習のループを知識空間上の適応的サンプリングプロセスとしてモデル化するNOVAフレームワークを提案する。
蓄積された真の知識が最終的に有限領域をカバーする十分な条件を特定し、それらの違反がどのように異なる障害モードを生成するかを示す。
我々は、ガイダンス、生成、検証、検証を通じて人間の増幅を形式化し、専門家の入力が自律的な探査障壁の近くで最も価値がある理由を説明する。
- 参考スコア(独自算出の注目度): 28.64853265018765
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Can AI systems discover genuinely new knowledge through iterative self improvement, and if so, at what cost? We introduce the NOVA framework, which models the common ``generate, verify, accumulate, retrain'' loop as an adaptive sampling process over a knowledge space. We identify sufficient conditions under which accumulated genuine knowledge eventually covers a finite domain, and show how their violations produce distinct failure modes: contamination, forgetting, exploration failure, and acceptance failure. We then analyze imperfect verification and identify a contamination trap: as easy-to-find knowledge is exhausted, the model mass assigned to new valid artifacts shrinks, so even small false-positive rates can cause invalid artifacts to enter the knowledge base faster than genuine discoveries. We clarify that Good--Turing estimation is a local batch-diversity diagnostic, not an estimator of the historically undiscovered valid mass that governs long-term discovery. Under a separate tail-equivalence assumption relating the model's effective discovery distribution to a Zipf law with exponent $α>1$, we prove that the cumulative generation cost required to obtain $D$ distinct genuine discoveries satisfies $R_{\mathrm{cum}}(D)=Θ(c_{\mathrm{gen}}D^α)$, where $c_{\mathrm{gen}}$ is the per-candidate generation cost. This scaling law quantifies asymptotic diminishing returns as the discovery frontier advances. Finally, we formalize human amplification through guidance, generation, and verification, explaining why expert input is most valuable near autonomous exploration barriers.
- Abstract(参考訳): AIシステムは、反復的な自己改善を通じて真に新しい知識を発見できるだろうか。
本稿では,知識空間上の適応的サンプリングプロセスとして,共通「生成,検証,蓄積,再学習」のループをモデル化したNOVAフレームワークを紹介する。
蓄積された真の知識が最終的に有限領域をカバーする十分な条件を特定し、それらの違反が汚染、忘れ、探索失敗、受け入れ失敗といった異なる障害モードをどのように生み出すかを示す。
そして、不完全な検証を分析し、汚染トラップを同定する: 容易で不確定な知識が枯渇すると、新しい有効なアーティファクトに割り当てられるモデル質量は減少し、小さな偽陽性率でさえ、偽のアーティファクトが真の発見よりも早く知識ベースに入る。
そこで我々は,Good-Turing Estimationは局所的なバッチ多様性診断であり,長期的発見を規定する歴史的に発見されていない有効質量を推定する指標ではないことを明らかにした。
モデルの有効発見分布を指数$α>1$のZipf法則に関連付ける別のテール等価仮定の下では、$D$別個の真の発見を得るために必要な累積生成コストが$R_{\mathrm{cum}}(D)=\(c_{\mathrm{gen}}D^α)$を満たすことを証明している。
このスケーリング法則は、発見フロンティアが進むにつれて漸近的な減少するリターンを定量化する。
最後に、ガイダンス、生成、検証を通じて人間の増幅を形式化し、専門家の入力が自律的な探査障壁の近くで最も価値がある理由を説明する。
関連論文リスト
- FIKA-Bench: From Fine-grained Recognition to Fine-Grained Knowledge Acquisition [54.31138496553705]
日常生活におけるきめ細かい認識は、しばしばクローズドブックの分類問題ではない。
既存のベンチマークは主に視覚的認識を評価しており、このアクティブな外部知識獲得能力は過小評価されている。
そこでは,システムが外部の証拠を探し,検証し,利用し,オープンエンドのきめ細かい認識質問に答えなければならない,きめ細かな知識獲得について検討する。
論文 参考訳(メタデータ) (2026-05-13T08:49:51Z) - AEGIS: From Clues to Verdicts -- Graph-Guided Deep Vulnerability Reasoning via Dialectics and Meta-Auditing [9.271196825503417]
大きな言語モデル(LLM)は、脆弱性検出にますます採用されているが、その推論は基本的には正しくない。
AEGISは、未解決の投機から、クローズドな事実ベース上の法医学的検証へ、検出をシフトする新しいマルチエージェントフレームワークである。
これは、主要なベースラインと比較して偽陽性率を最大54.40%削減し、1サンプルあたりの平均コストはタスク固有のトレーニングなしで0.09ドルである。
論文 参考訳(メタデータ) (2026-03-21T04:12:04Z) - Neuro-Symbolic Financial Reasoning via Deterministic Fact Ledgers and Adversarial Low-Latency Hallucination Detector [2.950245545999729]
検証可能な数値推論エージェント(VeNRA)について紹介する。
VeNRAは、RAGパラダイムを確率的テキストの検索から厳密な型付きUniversal Fact Ledger (UFL)による決定論的変数の検索へとシフトさせる
著者らは3ビリオンのSLMを訓練し、単一の推論予算を用いて予測候補を法医学的に監査する。
論文 参考訳(メタデータ) (2026-03-04T22:55:16Z) - EUBRL: Epistemic Uncertainty Directed Bayesian Reinforcement Learning [22.84927928856004]
疫学的な不確実性は、限られた知識による体系的な不確実性を反映している。
本稿では,ベイジアン強化学習アルゴリズムである$texttEUBRL$を提案する。
論文 参考訳(メタデータ) (2025-12-17T12:55:05Z) - Robust Q-Learning under Corrupted Rewards [2.07180164747172]
本稿では,Q-Learningアルゴリズムの強汚染攻撃モデルに対する堅牢性について検討する。
本研究では,実演的ベルマン演算子を構築するために,履歴報酬データを用いた新しい頑健な同期Q-ラーニングアルゴリズムを開発した。
我々の結果は、真の報酬分布が無限に支持されたとしても、有界な第2モーメントを許容するならば、維持され続ける。
論文 参考訳(メタデータ) (2024-09-05T04:37:02Z) - Are we certain it's anomalous? [57.729669157989235]
時系列における異常検出は、高度に非線形な時間的相関のため、異常は稀であるため、複雑なタスクである。
本稿では,異常検出(HypAD)におけるハイパボリック不確実性の新しい利用法を提案する。
HypADは自己指導で入力信号を再構築する。
論文 参考訳(メタデータ) (2022-11-16T21:31:39Z) - Principled Knowledge Extrapolation with GANs [92.62635018136476]
我々は,知識外挿の新たな視点から,対実合成を研究する。
本稿では, 知識外挿問題に対処するために, クローズド形式判別器を用いた対角ゲームが利用可能であることを示す。
提案手法は,多くのシナリオにおいて,エレガントな理論的保証と優れた性能の両方を享受する。
論文 参考訳(メタデータ) (2022-05-21T08:39:42Z) - MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven
Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。
正規化最大度(NML)分布の計算法を提案する。
得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文 参考訳(メタデータ) (2021-07-15T08:19:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。