論文の概要: Agents for Experiments, Experiments for Agents: A Design Grammar for AI-Enabled Experimental Science
- arxiv url: http://arxiv.org/abs/2605.17746v1
- Date: Mon, 18 May 2026 01:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.512268
- Title: Agents for Experiments, Experiments for Agents: A Design Grammar for AI-Enabled Experimental Science
- Title(参考訳): エージェントのエージェント,エージェントの実験:AIで実現可能な実験科学のための設計文法
- Authors: Yingjie Zhang, Chun Feng, Weizhang Zhu, Tianshu Sun,
- Abstract要約: AIシステムは、人間と対話し、協調し、マルチエージェントアレンジメントで操作するようになっている。
エージェントがこれらの配置を研究するためには実験が必要であり、可能な設計の空間拡大を探索するためには、エージェントが実験を行う必要があるかもしれない。
しかし、人間-AIとエージェントの実験的条件は依然として散文で規定されており、比較、再利用、監査が困難である。
- 参考スコア(独自算出の注目度): 4.184220050732621
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: AI systems are becoming active participants in organizational and knowledge work. They increasingly interact with humans, coordinate workflows, and operate in multi-agent arrangements. Understanding their effects therefore requires more than measuring output accuracy; it requires evidence about mechanisms, delegation, feedback, and control. Experiments remain central to this task, but they also face a recursive challenge: we need experiments for agents to study these arrangements, and we may need agents for experiments to help search the expanding space of possible designs. Yet experimental conditions for human-AI and agentic workflows are still largely specified in prose, making them difficult to compare, reuse, or audit. We frame this as a problem of workflow representation, traceability, and governance in AI-enabled knowledge production. We introduce SEED (Structural Encoding for Experimental Discovery), a framework that represents experimental conditions as typed actor-flow graphs. SEED supports three design functions: describing conditions as interaction structures, evaluating structural novelty relative to encoded prior designs, and generating candidate designs under feasibility and governance constraints. We report a lightweight empirical feasibility test that compares graph-blind and SEEDguided generation in a medical-triage design task. In this diagnostic contrast, SEED-guided candidate designs show clearer actor-flow changes, assumptions, and governance checks, supporting the feasibility of the grammar as a design aid. The commentary closes by identifying governance tensions around novelty, replication, validity, diversity of inquiry, and accountability.
- Abstract(参考訳): AIシステムは、組織や知識業務に積極的に参加している。
彼らはますます人間と対話し、ワークフローをコーディネートし、マルチエージェントアレンジメントで操作する。
そのため、その効果を理解するには、出力の正確さを測定する以上のことが必要であり、メカニズム、デリゲート、フィードバック、制御に関する証拠が必要である。
エージェントがこれらの配置を研究するためには実験が必要であり、可能な設計の空間拡大を探索するためには、エージェントが実験を行う必要があるかもしれない。
しかし、人間-AIとエージェントワークフローの実験的な条件は、まだ散文で定義されており、比較、再利用、監査が困難である。
私たちはこれを、AI対応の知識生産におけるワークフロー表現、トレーサビリティ、ガバナンスの問題として捉えています。
本稿では,実験条件を表すフレームワークSEED(Structural Encoding for Experimental Discovery)をアクターフローグラフとして紹介する。
SEEDは3つの設計機能をサポートしている: 条件を相互作用構造として記述し、コード化された事前設計に対する構造的新規性を評価し、実行可能性とガバナンスの制約の下で候補設計を生成する。
医用トリアージ設計作業におけるグラフ盲点とSEEDguided生成を比較した,軽量な経験的実現可能性テストについて報告する。
この診断コントラストにおいて、SEED誘導型候補設計は、より明確なアクターフローの変化、仮定、ガバナンスチェックを示し、設計支援としての文法の実現性をサポートする。
この注釈書は、新規性、複製、妥当性、調査の多様性、説明責任に関するガバナンスの緊張関係を特定することで、終了する。
関連論文リスト
- How to Interpret Agent Behavior [56.59836196946289]
本稿では,エージェントの動作を実行時に記述・解析するための分類法であるACT*ONOMYを紹介する。
共用語彙を提供することで、ACT*ONOMYは研究者、エージェントデザイナー、エンドユーザーがエージェントの振る舞いをより一貫して解釈するのに役立つ。
論文 参考訳(メタデータ) (2026-05-13T14:52:40Z) - SciNav: A General Agent Framework for Scientific Coding Tasks [12.136493066748391]
科学的コーディングタスクのためのエージェントフレームワークSciNav(Scientific Navigator)を紹介する。
我々のフレームワークは、制約付き検索予算の下で動作するように設計されている。
2つのベンチマークで異なるタイプのタスクにまたがってエージェントの有効性を示す。
論文 参考訳(メタデータ) (2026-03-11T11:57:51Z) - Bohrium + SciMaster: Building the Infrastructure and Ecosystem for Agentic Science at Scale [82.20980951765891]
エージェントサイエンスのスケーリングにはインフラストラクチャ・アンド・エコシステムアプローチが必要である,と我々は主張する。
BohriumはAI4S資産のマネージドでトレース可能なハブとして機能し、多様な科学データ、ソフトウェア、計算、実験室のシステムをエージェント対応の能力に変換する。
SciMasterはこれらの機能を長い水平科学に編成し、科学エージェントを合成して実行することができる。
論文 参考訳(メタデータ) (2025-12-23T16:04:41Z) - A Design Science Blueprint for an Orchestrated AI Assistant in Doctoral Supervision [7.136113739927491]
本研究は,社会技術仲介者として機能するAIアシスタントと共同パイロットのための設計科学の青写真である。
このようなシステムのリスクには、AI過信や学習の錯覚の可能性などが含まれる。
このコントリビューションは、組織が規律を越えて実施し、試行できるワークフローとガバナンスルールを備えた、先進的で文学的なデザインである。
論文 参考訳(メタデータ) (2025-10-22T04:20:35Z) - Towards Self-Evolving Benchmarks: Synthesizing Agent Trajectories via Test-Time Exploration under Validate-by-Reproduce Paradigm [60.36837655498119]
本稿では,トラジェクトリをベースとしたエージェント・ベンチマーク・複雑度進化フレームワークを提案する。
このフレームワークは、既存のベンチマークから元のタスクを受け取り、エージェントがそれをより難しい新しいタスクに進化させるよう促す。
GAIAベンチマークの実験では、TRACEフレームワークはタスクの複雑さを継続的に向上し、正確性の信頼性を向上させる。
論文 参考訳(メタデータ) (2025-10-01T01:52:52Z) - OAgents: An Empirical Study of Building Effective Agents [46.50371876218872]
キーエージェントコンポーネントにおける一般的な設計選択の影響を,公平かつ厳密な方法で検討する。
この結果に基づいて,新たな基盤エージェントフレームワークであるOAgentsをオープンソースとして開発しています。
論文 参考訳(メタデータ) (2025-06-17T17:59:02Z) - Understanding Software Engineering Agents Through the Lens of Traceability: An Empirical Study [15.97770416681533]
ソフトウェアエンジニアリングエージェント(SWEエージェント)は、ユーザの入力を解釈し、環境フィードバックに応答することで、自律的に動作する。
本稿では,SWEエージェントの動作を,実行トレースのレンズを通してシステマティックに解析する。
論文 参考訳(メタデータ) (2025-06-10T00:41:54Z) - ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。