論文の概要: KISS - Knowledge Infrastructure for Scientific Simulation: A Scaffolding for Agentic Earth Science
- arxiv url: http://arxiv.org/abs/2605.17856v1
- Date: Mon, 18 May 2026 04:57:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.814917
- Title: KISS - Knowledge Infrastructure for Scientific Simulation: A Scaffolding for Agentic Earth Science
- Title(参考訳): KISS - 科学シミュレーションのための知識基盤-
- Authors: Ziwei Li, Liujun Zhu, Yuchen Liu, Yichen Zhao, Birk Li, Ruiqi Wu, Junliang Jin, Jianyun Zhang,
- Abstract要約: 知識インフラストラクチャ(KI)は、専門知識を検証されたモデリング演算子に外部化する。
KIを搭載したエージェントは、最大84%の試験で、物理的に可算で検証可能なエンドツーエンドのシミュレーションを生み出した。
119個のKIの全体にわたって、決定のモデル化と失敗の是正は、基礎となる物理学が異なるにもかかわらず収束した。
- 参考スコア(独自算出の注目度): 9.554707285564593
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Process-based simulation models encode decades of scientific understanding across the Earth sciences, yet the communities most exposed to climate risk and resource scarcity are the least able to use them. Here, we introduce knowledge infrastructure (KI), an agent-actionable scaffold that externalizes expertise into validated modelling operators, staged domain protocols, and diagnostic recovery mechanisms. Across a 3,000-trial coupled-hydrology benchmark, agents equipped with KI produced physically plausible, verifiable end-to-end simulations in up to 84% of trials, while agents without KI plateaued below 40%. KI generalizes across disciplines. We packaged its construction into a Knowledge Dissection Toolkit (KDT) that autonomously produced KI enabling end-to-end agent execution of 117 additional process-based models across 14 Earth-science domains. Across all 119 KIs, modelling decisions and failure remedies converged despite different underlying physics, showing that operational expertise is structured and extractable rather than ad hoc. Demonstrations show KI-equipped agents lowering both the access barrier between non-specialist users and process-based simulation, and the integration barrier between modelling communities. Through this scaffold, process-based science can then evolve as a living scientific commons, answerable to whoever needs to know and extendable by whoever can contribute.
- Abstract(参考訳): プロセスベースのシミュレーションモデルは、地球科学の数十年にわたる科学的理解を符号化しているが、気候リスクや資源不足に最も晒されたコミュニティは、それらを使用することができない。
本稿では,知識基盤(KI)を紹介し,専門知識を検証されたモデリング演算子,ステージ化されたドメインプロトコル,診断回復機構に外部化するエージェント操作可能な足場について紹介する。
KIを装着したエージェントは、3000の試験的な結合水理のベンチマークで、最大84%の試験で、物理的に可塑性で検証可能なエンドツーエンドのシミュレーションを生成し、KIを使用していないエージェントは40%未満であった。
KIは様々な分野にまたがって一般化する。
我々は、その構築をKDT(Knowledge Dissection Toolkit)にまとめ、14の地球科学領域にまたがる117のプロセスベースモデルのエンドツーエンドエージェント実行を可能にするKIを自律的に生成した。
119のKIの全体にわたって、様々な基礎物理学にもかかわらず、モデル化された決定と失敗の修正が集約され、運用の専門知識はアドホックではなく構造化され、抽出可能であることが示されている。
デモでは、KI対応エージェントは、非専門家ユーザ間のアクセス障壁とプロセスベースのシミュレーション、モデリングコミュニティ間の統合障壁の両方を下げている。
この足場を通じて、プロセスベースの科学は、生きた科学コモンズとして進化し、誰でも知ることができ、貢献できる人によって拡張できる。
関連論文リスト
- SciResearcher: Scaling Deep Research Agents for Frontier Scientific Reasoning [54.194672921128785]
我々は、フロンティア科学データ構築のための完全に自動化されたエージェントフレームワークであるSciResearcherを紹介する。
SciResearcherは、学術的証拠に基づく様々な概念的および計算的なタスクを合成する。
我々は,HLE-Bio/Chem-Goldベンチマークで19.46%を達成できるエージェント基盤モデルであるSciResearcher-8Bを開発した。
論文 参考訳(メタデータ) (2026-05-02T15:26:45Z) - AI scientists produce results without reasoning scientifically [3.100302590436282]
大規模言語モデル(LLM)ベースのシステムは、科学的研究を自律的に行うためにますます多くデプロイされている。
そこで本研究では,8つの領域にまたがるLSMに基づく科学的エージェントの評価を行い,その実行と仮説に基づく調査を行った。
論文 参考訳(メタデータ) (2026-04-20T20:23:42Z) - CASCADE: Cumulative Agentic Skill Creation through Autonomous Development and Evolution [7.266404572341558]
大規模言語モデル(LLM)エージェントは現在、事前に定義されたツールや脆いツール生成に依存している。
これは、"LLM + tool use"から"LLM + skill acquisition"への移行の早期インスタンス化を表すセルフ進化型エージェントフレームワークである。
論文 参考訳(メタデータ) (2025-12-29T21:50:23Z) - Bohrium + SciMaster: Building the Infrastructure and Ecosystem for Agentic Science at Scale [82.20980951765891]
エージェントサイエンスのスケーリングにはインフラストラクチャ・アンド・エコシステムアプローチが必要である,と我々は主張する。
BohriumはAI4S資産のマネージドでトレース可能なハブとして機能し、多様な科学データ、ソフトウェア、計算、実験室のシステムをエージェント対応の能力に変換する。
SciMasterはこれらの機能を長い水平科学に編成し、科学エージェントを合成して実行することができる。
論文 参考訳(メタデータ) (2025-12-23T16:04:41Z) - Probing Scientific General Intelligence of LLMs with Scientist-Aligned Workflows [203.3527268311731]
PIM(Practical Inquiry Model)に基づく運用SGI定義を提案する。
深層研究、アイデア生成、ドライ/ウェット実験、実験推論の4つのタスクを通じて運用しています。
私たちのPIMによる定義、ワークフロー中心のベンチマーク、実証的な洞察は、真に科学的な発見に参加するAIシステムの基盤を確立します。
論文 参考訳(メタデータ) (2025-12-18T12:44:36Z) - TusoAI: Agentic Optimization for Scientific Methods [16.268579802762247]
大規模言語モデル(LLM)は、文学の合成、経験的データによる推論、ドメイン固有コードの生成において強力な能力を示している。
本稿では,評価機能を備えた科学的タスク記述を行うエージェントAIシステムであるTusoAIを紹介する。
TusoAIはドメイン知識を知識ツリー表現に統合し、反復的でドメイン固有の最適化とモデル診断を行う。
論文 参考訳(メタデータ) (2025-09-28T17:30:44Z) - ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z) - Kolb-Based Experiential Learning for Generalist Agents with Human-Level Kaggle Data Science Performance [81.05882480184587]
本稿では,自律エージェントに対するVygotskyのZPDを用いて,Kolbの学習サイクルの計算フレームワークを提案する。
Agent Kは、KolbとVygotskyにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。
金9個、銀8個、銅12個で、メダル獲得競争で金4個、銀4個を含む。エージェントKは、コルブとヴィーゴツキーにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。
論文 参考訳(メタデータ) (2024-11-05T23:55:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。