論文の概要: NORA: A Harness-Engineered Autonomous Research Agent for End-to-End Spatial Data Science
- arxiv url: http://arxiv.org/abs/2605.02092v1
- Date: Sun, 03 May 2026 23:22:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.076345
- Title: NORA: A Harness-Engineered Autonomous Research Agent for End-to-End Spatial Data Science
- Title(参考訳): NORA: エンド・ツー・エンド空間データサイエンスのためのハーネス駆動型自律型研究エージェント
- Authors: Bing Zhou, Xiao Huang, Huan Ning, Qiusheng Wu, Diya Li, Ziyi Zhang,
- Abstract要約: 本稿では,GIScienceと空間データサイエンスのための多エージェント自律研究システムであるNORA(Night Owl Research Agent)を紹介する。
NORAは、21のドメイン専門ワークフロースキル、9つの専門サブエージェント、カスタムモデルコンテキストプロトコル(MCP)サーバからなるスキルファーストアーキテクチャを通じて、完全な研究ライフサイクルを編成する。
我々は、科学研究エージェントのためのハーネスエンジニアリングの権威的な概念を定式化し、ライフサイクルフック、安全ゲート、ジェネレータと評価器の分離、人間とループの分離、そして状態の持続性が、信頼性と再現可能な自律的な研究をどのように保証するかを実証する。
- 参考スコア(独自算出の注目度): 13.671260946635813
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The automation of scientific research workflows has emerged as a transformative frontier in artificial intelligence, yet existing autonomous research agents remain largely domain-agnostic, lacking the specialized reasoning, method selection, and data acquisition capabilities required for rigorous spatial data science. This paper introduces NORA (Night Owl Research Agent), a harness-engineered, multi-agent autonomous research system purpose-built for GIScience and spatial data science. NORA orchestrates the complete research lifecycle through a skills-first architecture comprising 21 domain-specialized workflow skills, 9 specialist sub-agents, and custom Model Context Protocol (MCP) servers. Central to the system's design are two novel domain-specialized skills: a spatial analysis skill unit that encodes decision frameworks for exploratory spatial data analysis, spatial regression, and diagnostics; and a spatial data download skill that supports reproducible acquisition from authoritative geospatial data sources. We formalize the concept of harness engineering for scientific research agents, demonstrating how lifecycle hooks, safety gates, generator-evaluator separation, human-in-the-loop, and state persistence ensure reliable and reproducible autonomous research. We evaluate NORA through case studies by 6 domain specialists and 3 LLM reviewers across seven dimensions (novelty, quality, rigor, etc). Results demonstrate that domain-specialized harness engineering substantially improves the efficiency and quality of research output compared to general-purpose agent configurations.
- Abstract(参考訳): 科学研究ワークフローの自動化は人工知能の変革的フロンティアとして登場したが、既存の自律的な研究エージェントはドメインに依存しないままであり、厳密な空間データ科学に必要な特別な推論、メソッドの選択、データ取得能力が欠如している。
本稿では,GIScience と空間データ科学のために構築された,ハーネスエンジニアリングによる多エージェント自律型研究システム NORA (Night Owl Research Agent) を紹介する。
NORAは、21のドメイン専門ワークフロースキル、9つの専門サブエージェント、カスタムモデルコンテキストプロトコル(MCP)サーバからなるスキルファーストアーキテクチャを通じて、完全な研究ライフサイクルを編成する。
システムの設計の中心は、探索的空間データ分析、空間回帰、診断のための決定フレームワークを符号化する空間分析スキルユニットと、権威的な地理空間データソースからの再現可能な取得をサポートする空間データダウンロードスキルである。
我々は、科学研究エージェントのためのハーネスエンジニアリングの概念を定式化し、ライフサイクルフック、安全ゲート、ジェネレータと評価器の分離、人間のループと状態の持続性、信頼性と再現可能な自律的な研究をどのように保証するかを実証する。
我々は,6つのドメインスペシャリストと3つのLCMレビュアーによる7次元のケーススタディ(ノベルティ,品質,厳密さなど)を通してNORAを評価した。
その結果、汎用エージェント構成と比較して、ドメイン特化ハーネス工学は、研究成果の効率と品質を大幅に改善することを示した。
関連論文リスト
- SciResearcher: Scaling Deep Research Agents for Frontier Scientific Reasoning [54.194672921128785]
我々は、フロンティア科学データ構築のための完全に自動化されたエージェントフレームワークであるSciResearcherを紹介する。
SciResearcherは、学術的証拠に基づく様々な概念的および計算的なタスクを合成する。
我々は,HLE-Bio/Chem-Goldベンチマークで19.46%を達成できるエージェント基盤モデルであるSciResearcher-8Bを開発した。
論文 参考訳(メタデータ) (2026-05-02T15:26:45Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery [108.1082357960201]
エージェントAIは仮説生成、実験設計、実行、分析、反復的洗練の能力を示す。
この調査は、生命科学、化学、材料科学、物理学にまたがる自律的な科学的発見のドメイン指向のレビューを提供する。
論文 参考訳(メタデータ) (2025-08-18T05:25:54Z) - From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery [67.07598263346591]
大規模言語モデル(LLM)は科学的発見のパラダイムシフトを触媒している。
この調査は、この急成長する分野を体系的に分析し、科学におけるLLMの役割の変化とエスカレーション能力に重点を置いている。
論文 参考訳(メタデータ) (2025-05-19T15:41:32Z) - INDUS: Effective and Efficient Language Models for Scientific Applications [8.653859684720231]
言語モデル(LLM)は、自然言語処理(NLP)タスクにおいて顕著な結果を示した。
我々は、地球科学、生物学、物理学、生物物理学、惑星科学、天体物理学の密接に関連する分野に合わせた総合的なLLMスイートであるINDUSを開発した。
本稿では,RoBERTa(汎用)とSCIBERT(ドメイン固有)の両方のエンコーダにおいて,新たなタスクや関心領域における既存のタスクよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-05-17T12:15:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。