論文の概要: EurekAgent: Agent Environment Engineering is All You Need For Autonomous Scientific Discovery
- arxiv url: http://arxiv.org/abs/2606.13662v2
- Date: Fri, 12 Jun 2026 02:37:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 13:53:03.785243
- Title: EurekAgent: Agent Environment Engineering is All You Need For Autonomous Scientific Discovery
- Title(参考訳): EurekAgent: 自律的な科学的発見に必要なエージェント環境工学
- Authors: Amy Xin, Jiening Siow, Junjie Wang, Zijun Yao, Fanjin Zhang, Jian Song, Lei Hou, Juanzi Li,
- Abstract要約: 本稿では,計量駆動型自律科学的発見のための環境工学的エージェントシステムであるEurekAgentを紹介する。
環境工学とは、生産的行動を増幅する環境を構築することであり、報酬のハッキングや高いフリクションによる人間の監視といった有害な行動を抑えるものである。
我々は、コードと結果をオープンソース化し、信頼性の高い自律的な研究エージェントを開発するための中核研究の方向性として環境工学を要求します。
- 参考スコア(独自算出の注目度): 51.466674519159824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM-based agents have shown increasing potential in automating scientific discovery. Given an optimizable metric and an execution environment, they can propose, validate, and iterate scientific solutions, and have produced results that outperform human-designed approaches. As model capabilities continue to improve, we argue that the bottleneck for autonomous scientific discovery is shifting from prescribing agent workflows to designing agent environments: the resources, constraints, and interfaces that shape agent behavior. We frame this as environment engineering: building environments that amplify productive behaviors, such as open-ended exploration, systematic artifact management, and inter-agent collaboration, while suppressing harmful behaviors, such as reward hacking and high-friction human oversight. We present EurekAgent, an environment-engineered agent system for metric-driven autonomous scientific discovery. EurekAgent engineers the environment along four dimensions: permissions engineering for bounded agent execution and isolated evaluation; artifact engineering for filesystem and Git-based collaboration; budget engineering for budget-aware exploration; and human-in-the-loop engineering for easy human supervision and intervention. EurekAgent sets new state-of-the-art results on multiple mathematics, kernel engineering, and machine learning tasks, including new state-of-the-art 26-circle packing results discovered with less than $11 in total API cost. We open-source our code and results, and call for environment engineering as a core research direction for developing reliable autonomous research agents.
- Abstract(参考訳): LLMをベースとしたエージェントは、科学的発見の自動化の可能性を増している。
最適化可能な計量と実行環境が与えられたら、科学的解決策を提案し、検証し、反復することができる。
モデル機能の改善が進むにつれて、自律的な科学的発見のボトルネックは、エージェントのワークフローを規定するワークフローから、エージェントの振る舞いを形成するリソース、制約、インターフェースといった、エージェント環境の設計へと移行しつつある、と私たちは主張する。
オープンエンド探索や組織的アーティファクト管理,エージェント間のコラボレーションなど,生産的な行動を増幅する環境を構築すると同時に,報酬ハッキングや高フリクション人間の監視といった有害な行動を抑制する。
本稿では,計量駆動型自律科学的発見のための環境工学的エージェントシステムであるEurekAgentを紹介する。
EurekAgentは、境界付けられたエージェントの実行と分離された評価のためのパーミッションエンジニアリング、ファイルシステムとGitベースのコラボレーションのためのアーティファクトエンジニアリング、予算対応の探索のための予算エンジニアリング、人間の監督と介入を容易にするヒューマン・イン・ザ・ループエンジニアリングの4つの側面に沿って環境を設計する。
EurekAgentは、複数の数学、カーネルエンジニアリング、機械学習タスクに関する新しい最先端の結果を設定している。
我々は、コードと結果をオープンソース化し、信頼性の高い自律的な研究エージェントを開発するための中核研究の方向性として環境工学を要求します。
関連論文リスト
- El Agente Forjador: Task-Driven Agent Generation for Quantum Simulation [7.535793342235731]
El Agente Forjadorは、ユニバーサルコーディングエージェントが自律的にフォークし、検証し、再利用するマルチエージェントフレームワークである。
ツール生成と再利用のフレームワークがベースラインの精度を継続的に向上することを示す。
論文 参考訳(メタデータ) (2026-04-16T04:28:56Z) - Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning [62.499592503950026]
大規模言語モデル(LLM)は、ツールや環境とのマルチターンインタラクションを必要とする複雑なタスクを実行するために、自律エージェントに権限を与えている。
完全合成環境生成パイプラインであるエージェント・ワールド・モデル(AWM)を提案する。
私たちは、エージェントがリッチなツールセットと対話できる、毎日のシナリオをカバーする1,000の環境にスケールします。
論文 参考訳(メタデータ) (2026-02-10T18:55:41Z) - Bohrium + SciMaster: Building the Infrastructure and Ecosystem for Agentic Science at Scale [82.20980951765891]
エージェントサイエンスのスケーリングにはインフラストラクチャ・アンド・エコシステムアプローチが必要である,と我々は主張する。
BohriumはAI4S資産のマネージドでトレース可能なハブとして機能し、多様な科学データ、ソフトウェア、計算、実験室のシステムをエージェント対応の能力に変換する。
SciMasterはこれらの機能を長い水平科学に編成し、科学エージェントを合成して実行することができる。
論文 参考訳(メタデータ) (2025-12-23T16:04:41Z) - Simple Agents Outperform Experts in Biomedical Imaging Workflow Optimization [69.36509281190662]
生産レベルのコンピュータビジョンツールを科学データセットに適応させることは、重要な"ラストマイル"ボトルネックである。
我々は、AIエージェントを使ってこの手動コーディングを自動化し、最適なエージェント設計のオープンな問題に焦点を当てる。
簡単なエージェントフレームワークが、人間-専門家のソリューションよりも優れた適応コードを生成することを実証する。
論文 参考訳(メタデータ) (2025-12-02T18:42:26Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - Multi-Agent Simulation for AI Behaviour Discovery in Operations Research [0.9137554315375919]
ACE0は、マルチエージェントシミュレーションにおける行動発見のためのAIメソッドの適合性と生存性を評価するプラットフォームである。
本稿では, システムアーキテクチャの技術的概要, 航空宇宙領域における行動発見の事例研究, システムの質的評価について述べる。
論文 参考訳(メタデータ) (2021-08-30T15:14:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。