論文の概要: From 0-to-1 to 1-to-N: Reproducible Engineering Evidence for MetaAI Recursive Self-Design
- arxiv url: http://arxiv.org/abs/2606.09663v1
- Date: Mon, 08 Jun 2026 15:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.479736
- Title: From 0-to-1 to 1-to-N: Reproducible Engineering Evidence for MetaAI Recursive Self-Design
- Title(参考訳): 0-to-1から1-to-Nへ:メタAI再帰的自己設計のための再現可能なエンジニアリングエビデンス
- Authors: Dun Li, Jiatao Li, Hongzhi Li,
- Abstract要約: 再帰的自己設計(Recursive self-design)とは、AIシステムが構築、評価、改善されるメカニズムのAI支援による修正である。
本稿では、MetaAIを成熟したパラダイムではなく、人間種、AI拡張型開発パターンのワーキング用語として扱う。
- 参考スコア(独自算出の注目度): 5.100540270417814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recursive self-design refers to AI-assisted modification of the mechanisms by which an AI system is built, evaluated, and improved. This paper treats MetaAI not as a mature paradigm, but as a working term for a human-seeded, AI-expanded development pattern in which the design space itself becomes a target of modification. We propose an operational evidence framework with four criteria: inspectable target system, meta-level modifier, feedback-directed selection, and recursive continuation. We then map public systems, including Darwin Goedel Machine (DGM), STOP, Goedel Agent, and ShinkaEvolve, against these criteria. DGM provides the most direct currently reported evidence: its published results show improvement from 20% to 50% on SWE-bench Verified and from 14.2% to 30.7% on full Polyglot after 80 iterations, with ablations suggesting that both open-ended exploration and self-improvement contribute. Finally, we provide MetaAI-Mini, a reproducible HumanEval-based protocol and codebase. Because no completed model run is included in this build, MetaAI-Mini is reported as a protocol rather than as an experimental result.
- Abstract(参考訳): 再帰的自己設計(Recursive self-design)とは、AIシステムが構築、評価、改善されるメカニズムのAI支援による修正である。
本稿では、MetaAIを成熟したパラダイムではなく、デザイン空間自体が修正の対象となる、人間種、AI拡張開発パターンのワーキング用語として扱う。
本研究では,検査対象システム,メタレベル修飾器,フィードバック指向の選択,再帰的継続という4つの基準を持つ運用エビデンスフレームワークを提案する。
次に、これらの基準に対して、Darwin Goedel Machine(DGM)、STOP、Goedel Agent、およびShinkaEvolveなどの公開システムをマッピングする。
DGMは最も直接的に報告された証拠を提供している: 公表された結果は、SWE-bench Verifiedで20%から50%の改善、80回の反復で全ポリグロットで14.2%から30.7%の改善を示し、オープンエンド探査と自己改善の両方が寄与していることを示している。
最後に、再現可能なHumanEvalベースのプロトコルとコードベースであるMetaAI-Miniを提供する。
このビルドに完了したモデル実行は含まれないので、MetaAI-Miniは実験結果ではなくプロトコルとして報告される。
関連論文リスト
- Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses [57.20181537213498]
Agentic Harness Engineering (AHE)は、ハーネスエンジニアリングを自動化するクローズドループである。
AHEは3つの一致した可観測性柱を通じて課題に対処する。
10 AHE lift pass@1 on Terminal-Bench 2 from 69.7% to 77.0%。
SWE-bench-verifiedでは、種子よりも12%少ないトークンで合計成功率を上回り、ターミナルベンチ2では+5.1から+10.1ppのクロスファミリーゲインを得る。
論文 参考訳(メタデータ) (2026-04-28T16:55:02Z) - AI-NativeBench: An Open-Source White-Box Agentic Benchmark Suite for AI-Native Systems [52.65695508605237]
我々は、Model Context Protocol(MCP)とAgent-to-Agent(A2A)標準に基づいて、アプリケーション中心でホワイトボックスのAI-NativeベンチマークスイートであるAI-NativeBenchを紹介する。
エージェントスパンを分散トレース内の第一級市民として扱うことにより,本手法は,単純な機能以上の工学的特性の粒度解析を可能にする。
この研究は、モデル能力の測定から信頼性の高いAI-Nativeシステムへの移行を導く最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2026-01-14T11:32:07Z) - Alita-G: Self-Evolving Generative Agent for Agent Generation [54.49365835457433]
汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。
このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。
計算コストを削減しながら、大きな利益を得ることができます。
論文 参考訳(メタデータ) (2025-10-27T17:59:14Z) - Adaptive Monitoring and Real-World Evaluation of Agentic AI Systems [3.215065407261898]
大規模言語モデルと外部ツールを組み合わせたマルチエージェントシステムは、研究機関からハイテイクドメインへと急速に移行している。
この「先進的な」続編は、アルゴリズムのインスタンス化や経験的な証拠を提供することで、そのギャップを埋める。
AMDMは擬似ゴールドリフトで異常検出遅延を12.3秒から5.6秒に減らし、偽陽性率を4.5%から0.9%に下げる。
論文 参考訳(メタデータ) (2025-08-28T15:52:49Z) - SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents [58.174206358223415]
自己進化型エボダイドエージェント(SeEA-R1)は、自己進化型エボダイドエージェント用に設計された最初の強化微細調整フレームワークである。
本研究は,SEEA-R1が自律適応と報酬駆動型自己進化をサポートすることを示す。
論文 参考訳(メタデータ) (2025-06-26T18:00:07Z) - Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents [32.42616663576657]
本稿では,自己改善型AIであるDarwin G"odel Machine(DGM)を紹介する。
ダーウィンの進化とオープンエンドネスの研究に触発されたDGMは、生成されたコーディングエージェントのアーカイブを維持している。
エージェントをサンプリングし、ファンデーションモデルを使用して、サンプルされたエージェントの新しい、興味深いバージョンを作成することで、アーカイブを成長させる。
論文 参考訳(メタデータ) (2025-05-29T00:26:15Z) - How Well Can AI Build SD Models? [0.0]
本稿では,AI生成因果写像の評価のための2つの指標について紹介する。
我々は,11種類のLDMを,因果翻訳の能力とユーザの指示に適合する能力で試験した。
論文 参考訳(メタデータ) (2025-03-19T14:48:47Z) - ProcTHOR: Large-Scale Embodied AI Using Procedural Generation [55.485985317538194]
ProcTHORは、Embodied AI環境の手続き的生成のためのフレームワークである。
ナビゲーション、アレンジメント、アーム操作のための6つの具体化されたAIベンチマークに対して、最先端の結果を実証する。
論文 参考訳(メタデータ) (2022-06-14T17:09:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。