Fugu-MT 論文翻訳(概要): AgentEconomist: An End-to-end Agentic System Translating Economic Intuitions into Executable Computational Experiments

論文の概要: AgentEconomist: An End-to-end Agentic System Translating Economic Intuitions into Executable Computational Experiments

arxiv url: http://arxiv.org/abs/2604.27725v1
Date: Thu, 30 Apr 2026 11:17:04 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-01 16:31:54.061588
Title: AgentEconomist: An End-to-end Agentic System Translating Economic Intuitions into Executable Computational Experiments
Title（参考訳）: エージェント・エコノミスト:経済直観を計算可能な実験に翻訳するエンドツーエンドのエージェント・システム
Authors: Jiaju Chen, Jinghua Piao, Xia Xu, Songwei Li, Tong Xia, Xiangnan He, Yong Li,
Abstract要約: AgentEconomist(エージェントエコノミスト)は、直観を実行可能な計算実験に変換するために設計されたエンドツーエンドのインタラクティブシステムである。本システムは,最先端のジェネリックLLMよりも,文学的基盤が強く,斬新さと洞察力が高い研究思想を創出することを示す。全体として、AgentEconomistは人間とAIのコラボレーションパラダイムを採用しており、研究者は高レベルの直感に集中でき、一方で、翻訳と計算実行の労働集約的なプロセスをエージェントに委譲する。
参考スコア（独自算出の注目度）: 26.148624755019654
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A long-standing challenge in economics lies not in the lack of intuition, but in the difficulty of translating intuitive insights into verifiable research. To address this challenge, we introduce AgentEconomist, an end-to-end interactive system designed to translate abstract intuitions into executable computational experiments. Grounded in a domain-specific knowledge base covering over 13,000 high-quality academic papers, the system employs a modular multi-stage architecture. Specifically, the Idea Development Stage generates literature-grounded hypotheses, the Experimental Design Stage configures simulator-aligned experimental parameters and protocols, and the Experimental Execution Stage runs experiments and returns structured analyses. Together, these stages form a human-in-the-loop, iterative workflow that translates economic intuitions into executable computational experiments. Through extensive experiments involving human expert evaluation and large language models (LLMs) as judges, we show that the system generates research ideas with stronger literature grounding and higher novelty and insight than state-of-the-art generic LLMs. Overall, AgentEconomist adopts a human-AI collaboration paradigm that enables researchers to focus on high-level intuitions, while delegating the labor-intensive processes of translation and computational execution to agents.
Abstract（参考訳）: 経済学における長年の課題は直観の欠如ではなく、直感的な洞察を検証可能な研究に翻訳することの難しさにある。この課題に対処するために,抽象的な直観を実行可能な計算実験に変換するために設計された,エンドツーエンドの対話型システムであるAgentEconomistを紹介する。 13,000以上の高品質の学術論文を網羅したドメイン固有の知識ベースで構築されており、モジュラーマルチステージアーキテクチャを採用している。具体的には、イデオロギー開発段階は文学的な仮説を生成し、実験設計段階はシミュレータに沿った実験パラメータとプロトコルを設定し、実験実行段階は実験を実行し、構造化された分析を返す。これらの段階は、経済的な直観を実行可能な計算実験に翻訳する、ループ内での反復的なワークフローを形成する。審査員としての人間の専門家評価と大規模言語モデル(LLM)を含む広範な実験を通して,本システムは,最先端のジェネリックLLMよりも強い文献の基盤と,より斬新さと洞察力を持つ研究思想を創出することを示した。全体として、AgentEconomistは人間とAIのコラボレーションパラダイムを採用しており、研究者は高レベルの直感に集中でき、一方で、翻訳と計算実行の労働集約的なプロセスをエージェントに委譲する。

関連論文リスト

Pitfalls in Evaluating Interpretability Agents [91.49742416116635]
我々は,実験を反復的に設計し,仮説を洗練するエージェントシステムを構築した。我々の研究は、複雑な自動解釈可能性システムを評価する上での根本的な課題を実証している。
論文参考訳（メタデータ） (2026-03-20T16:27:17Z)
The Story is Not the Science: Execution-Grounded Evaluation of Mechanistic Interpretability Research [56.80927148740585]
我々は、動的に進化し、研究評価者としてAIエージェントを開発することで、スケーラビリティと厳密さの課題に対処する。我々は,機械的解釈可能性の研究をテストベッドとして使用し,標準化された研究成果を構築し,MechEvalAgentを開発した。我々の研究は、AIエージェントが研究評価を変革し、厳格な科学的実践の道を開く可能性を実証している。
論文参考訳（メタデータ） (2026-02-05T19:00:02Z)
HumanStudy-Bench: Towards AI Agent Design for Participant Simulation [11.906370453952265]
大規模言語モデル (LLMs) は、社会科学実験のシミュレーション参加者としてますます使われている。 HUMANSTUDY-BENCHは、LLMベースのエージェントを編成し、人体実験を再構築するベンチマークおよび実行エンジンである。科学的推論のレベルでの忠実度を評価するために,人間とエージェントの行動がどの程度一致しているかを定量化するための新しい指標を提案する。
論文参考訳（メタデータ） (2026-01-31T12:07:42Z)
Towards Agentic Intelligence for Materials Science [73.4576385477731]
この調査は、コーパスキュレーションからプレトレーニングから、シミュレーションと実験プラットフォームに面した目標条件付きエージェントまで、ユニークなパイプライン中心の視点を推し進める。コミュニティをブリッジし、参照の共有フレームを確立するために、まず、AIと材料科学をまたいだ用語、評価、ワークフローの段階を整列する統合レンズを提示する。
論文参考訳（メタデータ） (2026-01-29T23:48:43Z)
Probing Scientific General Intelligence of LLMs with Scientist-Aligned Workflows [203.3527268311731]
PIM(Practical Inquiry Model)に基づく運用SGI定義を提案する。深層研究、アイデア生成、ドライ/ウェット実験、実験推論の4つのタスクを通じて運用しています。私たちのPIMによる定義、ワークフロー中心のベンチマーク、実証的な洞察は、真に科学的な発見に参加するAIシステムの基盤を確立します。
論文参考訳（メタデータ） (2025-12-18T12:44:36Z)
SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文参考訳（メタデータ） (2025-11-29T09:18:39Z)
EpidemIQs: Prompt-to-Paper LLM Agents for Epidemic Modeling and Analysis [0.0]
大規模言語モデル(LLM)は、複雑な学際研究を自動化する新しい機会を提供する。 EpidemIQsは、ユーザ入力を統合し、文献のレビュー、分析的導出、ネットワークモデリング、シミュレーションの呼び出し、データの可視化と分析、そして最後に構造化された原稿での発見の文書化を行う、新しいマルチエージェントLCMフレームワークである。我々は、計算コスト、完成率、AIおよび生成されたレポートの人間専門家レビューを測定する様々なシナリオにおいて、エピデムIQを評価した。
論文参考訳（メタデータ） (2025-09-24T18:54:56Z)
ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、新しい作品のアイデアと運用のためのAIベースのシステムである。 ResearchAgentは、新しい問題を自動で定義し、手法と設計実験を提案し、繰り返し修正する。我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文参考訳（メタデータ） (2024-04-11T13:36:29Z)
Large Language Models Need Consultants for Reasoning: Becoming an Expert in a Complex Human System Through Behavior Simulation [5.730580726163518]
大規模言語モデル(LLM)は、数学、法学、コーディング、常識、世界知識といった分野において、人間に匹敵する優れた能力を示してきた。本稿では,生成エージェントによるシミュレーション技術を活用した新たな推論フレームワークであるMosaic Expert Observation Wall' (MEOW)を提案する。
論文参考訳（メタデータ） (2024-03-27T03:33:32Z)
Computational Experiments Meet Large Language Model Based Agents: A Survey and Perspective [16.08517740276261]
計算実験は複雑なシステムを研究するための貴重な方法として登場した。エージェントベースモデリング(ABM)における実際の社会システムを正確に表現することは、人間の多様性と複雑な特性のために困難である。大規模言語モデル(LLM)の統合が提案され、エージェントが人為的な能力を持つことができる。
論文参考訳（メタデータ） (2024-02-01T01:17:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。