論文の概要: Spec-Driven AI for Science: The ARIA Framework for Automated and Reproducible Data Analysis
- arxiv url: http://arxiv.org/abs/2510.11143v1
- Date: Mon, 13 Oct 2025 08:32:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 20:23:38.955127
- Title: Spec-Driven AI for Science: The ARIA Framework for Automated and Reproducible Data Analysis
- Title(参考訳): 科学のための仕様駆動AI: 自動化および再現可能なデータ分析のためのARIAフレームワーク
- Authors: Chuke Chen, Biao Luo, Nan Li, Boxiang Wang, Hang Yang, Jing Guo, Ming Xu,
- Abstract要約: ARIAは、自動および解釈可能なデータ分析のための、仕様駆動のヒューマン・イン・ザ・ループ・フレームワークである。
ARIAは、Command、Context、Code、Data、Orchesttion、AI Moduleという6つのレイヤを統合している。
ARIAは透明で協調的で再現可能な科学的発見のための新しいパラダイムを確立している。
- 参考スコア(独自算出の注目度): 23.28226188948918
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The rapid expansion of scientific data has widened the gap between analytical capability and research intent. Existing AI-based analysis tools, ranging from AutoML frameworks to agentic research assistants, either favor automation over transparency or depend on manual scripting that hinders scalability and reproducibility. We present ARIA (Automated Research Intelligence Assistant), a spec-driven, human-in-the-loop framework for automated and interpretable data analysis. ARIA integrates six interoperable layers, namely Command, Context, Code, Data, Orchestration, and AI Module, within a document-centric workflow that unifies human reasoning and machine execution. Through natural-language specifications, researchers define analytical goals while ARIA autonomously generates executable code, validates computations, and produces transparent documentation. Beyond achieving high predictive accuracy, ARIA can rapidly identify optimal feature sets and select suitable models, minimizing redundant tuning and repetitive experimentation. In the Boston Housing case, ARIA discovered 25 key features and determined XGBoost as the best performing model (R square = 0.93) with minimal overfitting. Evaluations across heterogeneous domains demonstrate ARIA's strong performance, interpretability, and efficiency compared with state-of-the-art systems. By combining AI for research and AI for science principles within a spec-driven architecture, ARIA establishes a new paradigm for transparent, collaborative, and reproducible scientific discovery.
- Abstract(参考訳): 科学データの急速な拡大は、分析能力と研究意図のギャップを広げた。
既存のAIベースの分析ツール(AutoMLフレームワークからエージェントリサーチアシスタントまで)は、透明性よりも自動化を好むか、スケーラビリティと再現性を阻害する手作業によるスクリプティングに依存している。
本稿では,ARIA(Automated Research Intelligence Assistant)について紹介する。
ARIAは、コマンド、コンテキスト、コード、データ、オーケストレーション、AIモジュールという6つの相互運用可能なレイヤをドキュメント中心のワークフローに統合し、人間の推論とマシン実行を統合する。
自然言語仕様を通じて、研究者は分析目標を定義し、ARIAは自動で実行可能なコードを生成し、計算を検証し、透過的なドキュメントを生成する。
高い予測精度を達成するだけでなく、ARIAは最適な特徴セットを迅速に識別し、適切なモデルを選択することができ、冗長なチューニングと反復的な実験を最小限にすることができる。
ボストン・ハウジングのケースでは、ARIAは25の鍵となる特徴を発見し、XGBoostを最小限のオーバーフィッティングで最高のパフォーマンスモデル (R square = 0.93) であると判断した。
異種ドメインによる評価は、最先端システムと比較して、ARIAの強い性能、解釈可能性、効率を示す。
仕様駆動アーキテクチャにおける研究のためのAIと科学原則のためのAIを組み合わせることで、ARIAは透明で協調的で再現可能な科学的発見のための新しいパラダイムを確立する。
関連論文リスト
- Barbarians at the Gate: How AI is Upending Systems Research [58.95406995634148]
システム研究は、新しいパフォーマンス指向アルゴリズムの設計と評価に長年注力してきたが、AI駆動のソリューション発見には特に適している、と私たちは主張する。
このアプローチをAI駆動システム研究(ADRS)と呼び、ソリューションを反復的に生成し、評価し、洗練する。
我々の研究結果は、AI時代のシステム研究の実践に急激な適応の必要性と破壊的な可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-10-07T17:49:24Z) - AutoLabs: Cognitive Multi-Agent Systems with Self-Correction for Autonomous Chemical Experimentation [0.10999592665107412]
AutoLabsは、自然言語命令を自動で実行可能なプロトコルに変換するように設計された、自己修正型マルチエージェントアーキテクチャである。
複雑化に関する5つのベンチマーク実験を特徴とする総合評価フレームワークを提案する。
以上の結果から,エージェント推論能力が成功の最も重要な要因であることが示唆された。
論文 参考訳(メタデータ) (2025-09-30T01:51:46Z) - TusoAI: Agentic Optimization for Scientific Methods [16.268579802762247]
大規模言語モデル(LLM)は、文学の合成、経験的データによる推論、ドメイン固有コードの生成において強力な能力を示している。
本稿では,評価機能を備えた科学的タスク記述を行うエージェントAIシステムであるTusoAIを紹介する。
TusoAIはドメイン知識を知識ツリー表現に統合し、反復的でドメイン固有の最適化とモデル診断を行う。
論文 参考訳(メタデータ) (2025-09-28T17:30:44Z) - AutoMind: Adaptive Knowledgeable Agent for Automated Data Science [70.33796196103499]
LLM(Large Language Model)エージェントは、現実世界のデータサイエンス問題に対処する大きな可能性を示している。
既存のフレームワークは、厳格で、事前定義された、柔軟性のないコーディング戦略に依存している。
適応的で知識のあるLLMエージェントフレームワークであるAutoMindを紹介する。
論文 参考訳(メタデータ) (2025-06-12T17:59:32Z) - AIRepr: An Analyst-Inspector Framework for Evaluating Reproducibility of LLMs in Data Science [5.064778712920176]
大規模言語モデル(LLM)は、実行可能なコード生成を通じてデータ分析を自動化するために、ますます使われるようになっている。
LLM 生成データ解析の $itRepr$oducibility を自動的に評価し,改善するための $itA$nalyst - $itI$nspector フレームワークである $itAIRepr を提示する。
論文 参考訳(メタデータ) (2025-02-23T01:15:50Z) - Autonomous Microscopy Experiments through Large Language Model Agents [4.241267255764773]
大規模言語モデル(LLM)は、材料研究のための自己運転実験室(SDL)に革命をもたらしている。
LLM駆動エージェントによる原子間力顕微鏡の自動化フレームワークであるArtificially Intelligent Lab Assistant (AILA)を紹介する。
アートモデルの現状が,基本的なタスクや調整シナリオに苦労していることに気付きました。
論文 参考訳(メタデータ) (2024-12-18T09:35:28Z) - Enhancing Feature Selection and Interpretability in AI Regression Tasks Through Feature Attribution [38.53065398127086]
本研究では、回帰問題に対する入力データの非形式的特徴をフィルタリングする特徴属性法の可能性について検討する。
我々は、初期データ空間から最適な変数セットを選択するために、統合グラディエントとk平均クラスタリングを組み合わせた機能選択パイプラインを導入する。
提案手法の有効性を検証するため, ターボ機械の開発過程における羽根振動解析を実世界の産業問題に適用した。
論文 参考訳(メタデータ) (2024-09-25T09:50:51Z) - TagLab: A human-centric AI system for interactive semantic segmentation [63.84619323110687]
TagLabは、大規模な画像に注釈をつけるための、オープンソースのAI支援ソフトウェアである。
画像アノテーションをスクラッチから支援ツールを通じてスピードアップし、カスタムの完全自動セマンティックセグメンテーションモデルを作成し、自動予測の迅速な編集を可能にする。
研究結果は,海洋生態学と建築遺産の2つの異なるシナリオで報告した。
論文 参考訳(メタデータ) (2021-12-23T16:50:06Z) - Integrated Benchmarking and Design for Reproducible and Accessible
Evaluation of Robotic Agents [61.36681529571202]
本稿では,開発とベンチマークを統合した再現性ロボット研究の新しい概念について述べる。
このセットアップの中心的なコンポーネントの1つはDuckietown Autolabであり、これは比較的低コストで再現可能な標準化されたセットアップである。
本研究では,インフラを用いて実施した実験の再現性を解析し,ロボットのハードウェアや遠隔実験室間でのばらつきが低いことを示す。
論文 参考訳(メタデータ) (2020-09-09T15:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。