Fugu-MT 論文翻訳(概要): Agon: An Autonomous Large-Scale Omnidisciplinary Research System Built on Prompt Economy

論文の概要: Agon: An Autonomous Large-Scale Omnidisciplinary Research System Built on Prompt Economy

arxiv url: http://arxiv.org/abs/2606.24177v1
Date: Tue, 23 Jun 2026 05:57:09 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-24 22:16:48.798892
Title: Agon: An Autonomous Large-Scale Omnidisciplinary Research System Built on Prompt Economy
Title（参考訳）: Agon: プロンプト経済を基盤とした自律型大規模専門研究システム
Authors: Youran Sun, Xingyu Ren, Chugang Yi, Jiaxuan Guo, Kejia Zhang, Jianda Du, Haizhao Yang,
Abstract要約: textscAgonは、ワークフロー内で何がチェック可能かを検証し、残りの判断を人間の科学者に任せる研究オーケストレータである。 textscAgonは、Prompt Economy、Future-Facing、Minimmal Prompts、OmniDisciplinary、Massive Parallelism、Zero-Codeの6つの設計原則に基づいて構築されている。
参考スコア（独自算出の注目度）: 8.317093846431076
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models are making research production scalable, shifting the bottleneck from producing artifacts to judging claims. We present \textsc{Agon}, a research orchestrator that validates what can be checked inside the workflow and leaves the remaining judgments to human scientists. \textsc{Agon} is built on six design principles: Prompt Economy, Future-Facing, Minimal Prompts, OmniDisciplinary, Massive Parallelism, and Zero-Code. We ran \textsc{Agon} across domains for 444 iterations of Prompt Economy loops, using only small starting topics and no human-written experimental code. These deployments demonstrate scalability while exposing new classes of failure. We organize these failures into a taxonomy along severity, fixability, visibility, and capability locus. The taxonomy separates failures the loops can see and fix from those that require human judgment. Together, these results show that \textsc{Agon} is pushing research toward a new paradigm: machine scales, human steers.
Abstract（参考訳）: 大規模な言語モデルは、研究成果をスケーラブルにし、ボトルネックをアーティファクトの生産からクレームの判断へとシフトさせています。ワークフロー内で何がチェック可能かを検証し、残りの判断を人間の科学者に委ねる研究オーケストレータである「textsc{Agon}」を提示する。 Prompt Economy、Future-Facing、Minimmal Prompts、OmniDisciplinary、Massive Parallelism、Zero-Codeの6つの設計原則に基づいて構築されている。 Prompt Economyのループを444回繰り返して、‘textsc{Agon}’をドメインで実行しました。これらのデプロイメントは、新しい失敗のクラスを公開しながら、スケーラビリティを示しています。これらの失敗を、深刻さ、修正可能性、可視性、能力の軌跡に沿った分類に整理します。分類学は、ループが見ることができる障害と人間の判断を必要とする障害を分離する。これらの結果から, マシンスケール, 人間のステアリングなど, 新たなパラダイムに向けた研究が進められている。

関連論文リスト

AI for Auto-Research: Roadmap & User Guide [107.0834449839233]
研究ライフサイクル全体にわたってAIをエンドツーエンドに分析する。我々は、信頼できる援助と信頼できない自律性の間に、鋭くステージに依存した境界を特定できる。障害モードを排除するのではなく、より大きな自動化が不明瞭であることが示されています。
論文参考訳（メタデータ） (2026-05-18T17:08:26Z)
Some Simple Economics of AGI [0.6117371161379209]
AIは生物学から認知を分離するので、測定可能な実行の限界コストはゼロに落ちる。成長に対する拘束力は、もはや知性ではなく、人間の検証帯域幅である。個人、企業、投資家、政策立案者のための実践的なプレイブックを導出します。
論文参考訳（メタデータ） (2026-02-24T14:29:45Z)
Understanding In-context Learning of Addition via Activation Subspaces [73.8295576941241]
そこで本研究では,入力に整数$k$を追加するという真の予測規則を,数ショット学習タスクの構造化されたファミリについて検討する。次に、次元の減少と分解を通じて、個々の頭部の詳細な分析を行う。この結果から,前進パスを横断する局所化頭部の低次元部分空間の追跡が,言語モデルにおける微粒化計算構造に対する洞察を与えることを示す。
論文参考訳（メタデータ） (2025-05-08T11:32:46Z)
The Superalignment of Superhuman Intelligence with Large Language Models [63.96120398355404]
我々は,この疑問に答えるために,学習の観点からスーパーアライメントの概念について議論する。スーパーアライメントにおけるいくつかの重要な研究課題、すなわち、弱いから強い一般化、スケーラブルな監視、評価に焦点を当てる。本稿では,学習者モデルの弱点を露呈しようとする敵対的クエリを生成する攻撃者,最小限の人間専門家とともに,批判モデルによって生成されたスケーラブルなフィードバックから学習することで自己を洗練させる学習者,与えられた質問応答対に対する批判や説明を生成する批判者,そして批判によって学習者を改善することを目的とした,3つのモジュールからなるスーパーアライメントの概念的枠組みを提案する。
論文参考訳（メタデータ） (2024-12-15T10:34:06Z)
Generative Models as a Complex Systems Science: How can we make sense of large language model behavior? [75.79305790453654]
事前訓練されたモデルから望ましい振る舞いを排除し、望ましくないモデルを避けながら、NLPを再定義した。言語モデルの振る舞いをタスク間性能を説明するカテゴリに分解する体系的な取り組みについて論じる。
論文参考訳（メタデータ） (2023-07-31T22:58:41Z)
Chaining Simultaneous Thoughts for Numerical Reasoning [92.2007997126144]
テキストによる数値推論は、AIシステムにとって不可欠なスキルであるべきです。これまでの研究は方程式の構造をモデル化することに集中し、様々な構造化デコーダを提案してきた。我々は、有向非巡回グラフを用いてステップを推論する数値推論器CANTORを提案する。
論文参考訳（メタデータ） (2022-11-29T18:52:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。