論文の概要: Continuous Knowledge Metabolism: Generating Scientific Hypotheses from Evolving Literature
- arxiv url: http://arxiv.org/abs/2604.12243v1
- Date: Tue, 14 Apr 2026 03:41:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.21798
- Title: Continuous Knowledge Metabolism: Generating Scientific Hypotheses from Evolving Literature
- Title(参考訳): 連続的知識代謝:進化する文学から科学的仮説を生成する
- Authors: Jinkai Tao, Yubo Wang, Xiaoyu Liu, Menglin Yang,
- Abstract要約: 継続的知識代謝(CKM)は、新しい発見が到着するにつれて、スライディングタイムウィンドウと更新を通じて科学文献を処理する。
CKM-Fullは、新しい発見を新しい発見、確認、矛盾、知識変化信号の検出、そして完全な進化の条件として分類する。
- 参考スコア(独自算出の注目度): 9.906449135997837
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific hypothesis generation requires tracking how knowledge evolves, not just what is currently known. We introduce Continuous Knowledge Metabolism (CKM), a framework that processes scientific literature through sliding time windows and incrementally updates a structured knowledge base as new findings arrive. We present CKM-Lite, an efficient variant that achieves strong predictive coverage through incremental accumulation, outperforming batch processing on hit rate (+2.8%, p=0.006), hypothesis yield (+3.6, p<0.001), and best-match alignment (+0.43, p<0.001) while reducing token cost by 92%. To understand what drives these differences, we develop CKM-Full, an instrumented variant that categorizes each new finding as novel, confirming, or contradicting, detects knowledge change signals, and conditions hypothesis generation on the full evolution trajectory. Analyzing 892 hypotheses generated by CKM-Full across 50 research topics, alongside parallel runs of the other variants, we report four empirical observations: (1) incremental processing outperforms batch baseline across predictive and efficiency metrics; (2) change-aware instrumentation is associated with higher LLM-judged novelty (Cohen's d=3.46) but lower predictive coverage, revealing a quality-coverage trade-off; (3) a field's trajectory stability is associated with hypothesis success (r=-0.28, p=0.051), suggesting boundary conditions for literature-based prediction; (4) knowledge convergence signals are associated with nearly 5x higher hit rate than contradiction signals, pointing to differential predictability across change types. These findings suggest that the character of generated hypotheses is shaped not only by how much literature is processed, but also by how it is processed. They further indicate that evaluation frameworks must account for the quality-coverage trade-off rather than optimize for a single metric.
- Abstract(参考訳): 科学的仮説の生成は、現在知られていることだけでなく、知識の進化の追跡を必要とする。
このフレームワークは、スライディングタイムウィンドウを通じて科学文献を処理し、新たな発見が到着すると、構造化知識ベースを漸進的に更新する。
本稿では, 逐次累積, バッチ処理のヒットレート(+2.8%, p=0.006), 仮説収率(+3.6, p<0.001), ベストマッチアライメント(+0.43, p<0.001) に優れ, トークンコストを92%削減し, 高い予測カバレッジを達成できるCKM-Liteを提案する。
CKM-Fullは、新しい発見を新しい発見、確認、あるいは矛盾、知識変化信号の検出、および完全な進化軌道上の条件仮説生成に分類する。
CKM-Full が生成した 892 の仮説を50 つの研究トピックで分析し、他の変種を並列に実行し、(1) 逐次処理が予測と効率の指標でバッチベースラインを上回り、(2) 変化認識装置はより高い LLM-judged ノベルティ (Cohen's d=3.46) に関連付けられるが、予測的カバレッジは低く、品質被覆のトレードオフが明らかである、(3) フィールドの軌道安定性は仮説の成功(r=-0.28, p=0.051)に関連し、文献に基づく予測の境界条件の提案、(4) 知識収束信号は矛盾信号よりも約5倍高いヒット率に関連している、という経験的観察を報告した。
これらの結果から, 生成した仮説の特徴は, どれだけの文献が処理されたかだけでなく, どのように処理されたかによっても形成されることが示唆された。
さらに、評価フレームワークは、単一のメトリクスを最適化するよりも、品質カバレッジのトレードオフを考慮しなければなりません。
関連論文リスト
- Complex-Valued Unitary Representations as Classification Heads for Improved Uncertainty Quantification in Deep Neural Networks [1.932555230783329]
現代のディープニューラルネットワークは高い予測精度を達成するが、キャリブレーションは不十分である。
本稿では、バックボーンの特徴を複素値空間に投影する量子インスピレーション付き分類ヘッドアーキテクチャを提案する。
CIFAR-10のアブレーション実験により, 統一等級ヘッド(カイリーユニタリ, マグニチュード, ソフトマックスで読み出す複雑な特徴)が0.0146の予測誤差(ECE)を達成し, 標準ソフトマックスヘッドの2.4倍の改善を示した。
驚くべきことに、ソフトマックスの読み出しをヒルベルト則測定層(量子力学的に動機づけられたアプローチ)に置き換えると、キャリブレーションは0.0819に低下する。
論文 参考訳(メタデータ) (2026-02-17T00:45:27Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - Theoretical Convergence of SMOTE-Generated Samples [47.26889442476884]
SMOTEの収束特性の厳密な理論的解析を行う。
合成確率変数 Z が基底変数 X に確率収束することを証明する。
最寄りのランクの低い値は、より高速な収束につながる。
論文 参考訳(メタデータ) (2026-01-05T09:19:45Z) - Mitigating LLM Hallucination via Behaviorally Calibrated Reinforcement Learning [32.32593439144886]
振舞い校正された強化学習により、小さなモデルは不確実な定量化においてフロンティアモデルを超えることができる。
当社のモデルでは,GPT-5の0.207を超える精度向上率(0.806)を挑戦的なドメイン内評価において達成している。
論文 参考訳(メタデータ) (2025-12-22T22:51:48Z) - Bridging the Gap Between Bayesian Deep Learning and Ensemble Weather Forecasts [100.26854618129039]
天気予報は、大気のカオス的な性質によって根本的に挑戦されている。
ベイジアンディープラーニング(BDL)の最近の進歩は、有望だがしばしば非接続な代替手段を提供する。
気象予報のための統合型BDLフレームワークにより,これらのパラダイムを橋渡しする。
論文 参考訳(メタデータ) (2025-11-18T07:49:52Z) - Bayes-Entropy Collaborative Driven Agents for Research Hypotheses Generation and Optimization [4.469102316542763]
本稿では,HypoAgentsと呼ばれるマルチエージェント協調フレームワークを提案する。
多様性のサンプリングを通じて仮説を生成し、事前の信念を確立する。
その後、外部文献の証拠収集にRAG(erieval-augmented generation)を採用している。
情報エントロピー$H = - sum p_ilog p_i$ を用いて高不確かさ仮説を特定し、それらを積極的に洗練する。
論文 参考訳(メタデータ) (2025-08-03T13:05:32Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization [57.69385990442078]
大規模言語モデル(LLM)は、入力プロンプト(クエスト)にまたがる様々なレベルの信頼を示す。
セマンティックエントロピー(Semantic entropy)は、プロンプトが与えられた複数の生成された回答における意味の多様性を測定し、ポリシー更新の規模を変調するためにこれを使用する。
論文 参考訳(メタデータ) (2025-05-18T10:20:59Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Generalized Sliced Distances for Probability Distributions [47.543990188697734]
我々は、一般化スライス確率測定(GSPM)と呼ばれる、幅広い確率測定値の族を紹介する。
GSPMは一般化されたラドン変換に根付いており、ユニークな幾何学的解釈を持つ。
GSPMに基づく勾配流を生成モデル応用に適用し、軽度な仮定の下では、勾配流が大域的最適に収束することを示す。
論文 参考訳(メタデータ) (2020-02-28T04:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。