論文の概要: SciHorizon-DataEVA: An Agentic System for AI-Readiness Evaluation of Heterogeneous Scientific Data
- arxiv url: http://arxiv.org/abs/2604.26645v1
- Date: Wed, 29 Apr 2026 13:11:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.411579
- Title: SciHorizon-DataEVA: An Agentic System for AI-Readiness Evaluation of Heterogeneous Scientific Data
- Title(参考訳): SciHorizon-DataEVA:異種科学データのAI可読性評価のためのエージェントシステム
- Authors: Dianyu Liu, Chuan Qin, Xi Chen, Xiaohan Li, Wenxi Xu, Yuyang Wang, Xin Chen, Yuanchun Zhou, Hengshu Zhu,
- Abstract要約: SciHorizon-DataEVAは、科学データのスケーラブルなAI可読性評価のための新しいエージェントシステムである。
評価基準レベルでは、Sci-TQA2原則を導入し、信頼の信頼性、データ品質、AI適合性、科学的適応性の4つの相補的な側面にAI対応を整理する。
我々のSci-TQA2-Evalは、軽量なデータセットプロファイリング、応用性を考慮したメトリックアクティベーション、知識に富んだ計画を組み合わせることで、データセット認識評価仕様を動的に構築する。
- 参考スコア(独自算出の注目度): 31.749503531377812
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI-for-Science (AI4Science) is increasingly transforming scientific discovery by embedding machine learning models into prediction, simulation, and hypothesis generation workflows across domains. However, the effectiveness of these models is fundamentally constrained by the AI-readiness of scientific data, for which no scalable and systematic evaluation mechanism currently exists. In this work, we propose SciHorizon-DataEVA, a novel agentic system to scalable AI-readiness evaluation of heterogeneous scientific data. At the evaluation-criteria level, we introduce the Sci-TQA2 principles, which organize AI-readiness into four complementary dimensions: Governance Trustworthiness, Data Quality, AI Compatibility, and Scientific Adaptability. Each dimension is decomposed into measurable atomic elements that enable fine-grained and executable assessment. To operationalize these principles at scale, we develop Sci-TQA2-Eval, a hierarchical multi-agent evaluation approach orchestrated through a directed, cyclic workflow. Our Sci-TQA2-Eval dynamically constructs dataset-aware evaluation specifications by combining lightweight dataset profiling, applicability-aware metric activation, and knowledge-augmented planning grounded in domain constraints and dataset-paper signals. These specifications are executed through an adaptive, tool-centric evaluation mechanism with built-in verification and self-correction, enabling scalable and reliable assessment across heterogeneous scientific data. Extensive experiments on scientific datasets spanning multiple domains demonstrate the effectiveness and generality of SciHorizon-DataEVA for principled AI-readiness evaluation.
- Abstract(参考訳): AI-for-Science(AI4Science)は、機械学習モデルを予測、シミュレーション、仮説生成ワークフローに組み込むことによって、科学的な発見をドメイン全体に拡大している。
しかし、これらのモデルの有効性は、現在、スケーラブルで体系的な評価機構が存在しない科学データのAI可読性によって根本的に制約されている。
本研究では,異種科学データのスケーラブルなAI可読性評価のためのエージェントシステムであるSciHorizon-DataEVAを提案する。
評価基準レベルでは、Sci-TQA2原則を導入し、信頼の信頼性、データ品質、AI適合性、科学的適応性の4つの相補的な側面にAI対応を整理する。
各次元は、微細で実行可能な評価を可能にする測定可能な原子要素に分解される。
Sci-TQA2-Evalという階層型マルチエージェント評価手法を開発し,これらの原理を大規模に運用する。
我々のSci-TQA2-Evalは、軽量なデータセットプロファイリング、適用性を考慮したメトリックアクティベーション、ドメイン制約とデータセットペーパー信号に基づく知識強化計画を組み合わせることで、データセット認識評価仕様を動的に構築する。
これらの仕様は、組み込まれた検証と自己補正を備えた適応的なツール中心の評価メカニズムを通じて実行され、異種科学データ間のスケーラブルで信頼性の高い評価を可能にする。
複数の領域にまたがる科学データセットに関する大規模な実験は、原則化されたAIの可読性評価のためのSciHorizon-DataEVAの有効性と汎用性を実証している。
関連論文リスト
- SciEvalKit: An Open-source Evaluation Toolkit for Scientific General Intelligence [99.30934038146965]
SciEvalKitは、科学知能のコア能力に焦点を当てている。
物理学、化学から天文学、材料科学まで6つの主要な科学領域をサポートしている。
このツールキットはオープンソースで、コミュニティ主導の開発とAI4Scienceの進歩を促進するために積極的にメンテナンスされている。
論文 参考訳(メタデータ) (2025-12-26T17:36:02Z) - TusoAI: Agentic Optimization for Scientific Methods [16.268579802762247]
大規模言語モデル(LLM)は、文学の合成、経験的データによる推論、ドメイン固有コードの生成において強力な能力を示している。
本稿では,評価機能を備えた科学的タスク記述を行うエージェントAIシステムであるTusoAIを紹介する。
TusoAIはドメイン知識を知識ツリー表現に統合し、反復的でドメイン固有の最適化とモデル診断を行う。
論文 参考訳(メタデータ) (2025-09-28T17:30:44Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery [108.1082357960201]
エージェントAIは仮説生成、実験設計、実行、分析、反復的洗練の能力を示す。
この調査は、生命科学、化学、材料科学、物理学にまたがる自律的な科学的発見のドメイン指向のレビューを提供する。
論文 参考訳(メタデータ) (2025-08-18T05:25:54Z) - Data Readiness for Scientific AI at Scale [0.0]
本稿では,AIのためのデータ準備性(DRAI)の原則が,基礎モデルのトレーニングに使用されるリーダーシップスケールの科学的データセットにどのように適用されるかを検討する。
我々は, 気候, 核融合, 生物・健康, 材料など, 4つの代表的な領域にわたる古細菌の分析を行った。
我々は、データ準備レベル(AI対応)とデータ処理ステージ(シャードに最も近い)からなる2次元準備性フレームワークを導入する。
論文 参考訳(メタデータ) (2025-07-30T18:30:37Z) - SciHorizon: Benchmarking AI-for-Science Readiness from Scientific Data to Large Language Models [36.724471610075696]
SciHorizonはAI4Scienceの可読性を評価するために設計された総合的なアセスメントフレームワークである。
まず、品質、FAIRネス、説明可能性、コンプライアンスの4つの重要な側面を含む、AI対応の科学データを評価するための一般化可能なフレームワークを紹介します。
我々は、地球、生命、材料科学のためのAI対応データセットのレコメンデーションリストを提示し、この分野に新しく独自の貢献をする。
論文 参考訳(メタデータ) (2025-03-12T11:34:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。