論文の概要: InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery
- arxiv url: http://arxiv.org/abs/2602.08990v1
- Date: Mon, 09 Feb 2026 18:36:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.42393
- Title: InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery
- Title(参考訳): InternAgent-1.5: 長距離自律科学発見のための統合エージェントフレームワーク
- Authors: Shiyang Feng, Runmin Ma, Xiangchao Yan, Yue Fan, Yusong Hu, Songtao Huang, Shuaiyu Zhang, Zongsheng Cao, Tianshuo Peng, Jiakang Yuan, Zijie Guo, Zhijie Zhong, Shangheng Du, Weida Wang, Jinxin Shi, Yuhao Zhou, Xiaohan He, Zhiyin Yu, Fangchen Yu, Qihao Zheng, Jiamin Wu, Mianxin Liu, Chi Zhang, Shaowei Hou, Shuya Li, Yankai Jiang, Wenjie Lou, Lilong Wang, Zifu Wang, Jiong Wang, Wanghan Xu, Yue Deng, Dongrui Liu, Yiheng Wang, Wenlong Zhang, Fenghua Ling, Shufei Zhang, Xiaosong Wang, Shuangjia Zheng, Xun Huang, Siqi Sun, Shuyue Hu, Peng Ye, Chunfeng Song, Bin Wang, Conghui He, Yihao Liu, Xin Li, Qibin Hou, Tao Chen, Xiangyu Yue, Bin Wang, Liang He, Dahua Lin, Bowen Zhou, Bo Zhang, Lei Bai,
- Abstract要約: InternAgent-1.5は、エンドツーエンドの科学的発見を目的とした統合システムである。
このシステムは、生成、検証、進化のための3つの調整されたサブシステムで構成される構造化アーキテクチャ上に構築されている。
InternAgent-1.5をGAIA,HLE,GPQA,FrontierScienceなどの科学的推論ベンチマークで評価した。
- 参考スコア(独自算出の注目度): 138.0404718571971
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce InternAgent-1.5, a unified system designed for end-to-end scientific discovery across computational and empirical domains. The system is built on a structured architecture composed of three coordinated subsystems for generation, verification, and evolution. These subsystems are supported by foundational capabilities for deep research, solution optimization, and long horizon memory. The architecture allows InternAgent-1.5 to operate continuously across extended discovery cycles while maintaining coherent and improving behavior. It also enables the system to coordinate computational modeling and laboratory experimentation within a single unified system. We evaluate InternAgent-1.5 on scientific reasoning benchmarks such as GAIA, HLE, GPQA, and FrontierScience, and the system achieves leading performance that demonstrates strong foundational capabilities. Beyond these benchmarks, we further assess two categories of discovery tasks. In algorithm discovery tasks, InternAgent-1.5 autonomously designs competitive methods for core machine learning problems. In empirical discovery tasks, it executes complete computational or wet lab experiments and produces scientific findings in earth, life, biological, and physical domains. Overall, these results show that InternAgent-1.5 provides a general and scalable framework for autonomous scientific discovery.
- Abstract(参考訳): InternAgent-1.5は、計算領域と経験領域をまたいだエンドツーエンドの科学的発見を目的とした統合システムである。
このシステムは、生成、検証、進化のための3つの調整されたサブシステムで構成される構造化アーキテクチャ上に構築されている。
これらのサブシステムは、ディープリサーチ、ソリューション最適化、長い水平メモリの基本的な機能によってサポートされている。
アーキテクチャにより、InternAgent-1.5は、一貫性と振る舞いの改善を維持しながら、拡張された発見サイクルを継続的に運用することができる。
また、単一の統一システム内での計算モデルと実験実験の協調を可能にする。
我々は,GAIA,HLE,GPQA,FrontierScienceなどの科学的推論ベンチマークを用いて,InternAgent-1.5の評価を行い,強力な基礎能力を示す先進的な性能を実現する。
これらのベンチマークの他に、発見タスクの2つのカテゴリを更に評価する。
アルゴリズム発見タスクでは、InternAgent-1.5はコア機械学習問題の競合する手法を自律的に設計する。
実験的な発見タスクでは、完全な計算または湿った実験実験を実行し、地球、生命、生物学的、物理的領域における科学的発見を生成する。
これらの結果は、InternAgent-1.5が自律的な科学的発見のための汎用的でスケーラブルなフレームワークを提供することを示している。
関連論文リスト
- S1-NexusAgent: a Self-Evolving Agent Framework for Multidisciplinary Scientific Research [0.0]
S1-NexusAgentは科学研究のための自己進化型エージェントフレームワークである。
S1-NexusAgentは階層的なPlan-and-CodeAct実行パラダイムを採用し、サブタスクレベルのツール実行からグローバルな科学的計画を切り離している。
S1-NexusAgentは最先端の一般化性能を達成し、複雑な科学的タスクにおけるその有効性と能力を検証する。
論文 参考訳(メタデータ) (2026-02-02T02:33:25Z) - ResearchGPT: Benchmarking and Training LLMs for End-to-End Computer Science Research Workflows [109.34792911044394]
CS-54k(CS-54k)は、コンピュータ科学におけるQ&Aペアの高品質なコーパスである。
CS-4kは、科学研究を支援するAIの能力を評価するためのベンチマークである。
CS-50kは大規模なトレーニングデータセットである。
論文 参考訳(メタデータ) (2025-10-23T07:07:35Z) - From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery [108.1082357960201]
エージェントAIは仮説生成、実験設計、実行、分析、反復的洗練の能力を示す。
この調査は、生命科学、化学、材料科学、物理学にまたがる自律的な科学的発見のドメイン指向のレビューを提供する。
論文 参考訳(メタデータ) (2025-08-18T05:25:54Z) - ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。