論文の概要: AlphaGo Moment for Model Architecture Discovery
- arxiv url: http://arxiv.org/abs/2507.18074v1
- Date: Thu, 24 Jul 2025 03:57:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:42.93722
- Title: AlphaGo Moment for Model Architecture Discovery
- Title(参考訳): モデルアーキテクチャ発見のためのAlphaGo Moment
- Authors: Yixiu Liu, Yang Nan, Weixian Xu, Xiangkun Hu, Lyumanshan Ye, Zhen Qin, Pengfei Liu,
- Abstract要約: AI研究のための人工超知能の最初の実証であるAII-Archを紹介する。
ASI-Archは完全に自律的なシステムで、AIが独自のアーキテクチャ革新を実行できるようにすることによって制約を揺さぶる。
我々は2万時間にわたって1,773個の自律的な実験を行い、106個の革新的なSOTA(State-of-the-art)線形アテンションアーキテクチャを発見しました。
- 参考スコア(独自算出の注目度): 26.258185487878333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While AI systems demonstrate exponentially improving capabilities, the pace of AI research itself remains linearly bounded by human cognitive capacity, creating an increasingly severe development bottleneck. We present ASI-Arch, the first demonstration of Artificial Superintelligence for AI research (ASI4AI) in the critical domain of neural architecture discovery--a fully autonomous system that shatters this fundamental constraint by enabling AI to conduct its own architectural innovation. Moving beyond traditional Neural Architecture Search (NAS), which is fundamentally limited to exploring human-defined spaces, we introduce a paradigm shift from automated optimization to automated innovation. ASI-Arch can conduct end-to-end scientific research in the domain of architecture discovery, autonomously hypothesizing novel architectural concepts, implementing them as executable code, training and empirically validating their performance through rigorous experimentation and past experience. ASI-Arch conducted 1,773 autonomous experiments over 20,000 GPU hours, culminating in the discovery of 106 innovative, state-of-the-art (SOTA) linear attention architectures. Like AlphaGo's Move 37 that revealed unexpected strategic insights invisible to human players, our AI-discovered architectures demonstrate emergent design principles that systematically surpass human-designed baselines and illuminate previously unknown pathways for architectural innovation. Crucially, we establish the first empirical scaling law for scientific discovery itself--demonstrating that architectural breakthroughs can be scaled computationally, transforming research progress from a human-limited to a computation-scalable process. We provide comprehensive analysis of the emergent design patterns and autonomous research capabilities that enabled these breakthroughs, establishing a blueprint for self-accelerating AI systems.
- Abstract(参考訳): AIシステムは能力の向上を指数関数的に示す一方で、AI研究自体のペースは人間の認知能力によって線形に拘束され、開発ボトルネックがますます深刻になる。
AI研究のための人工超知能(ASI4AI)の最初のデモンストレーションであるASI-Archを紹介します。AIが独自のアーキテクチャ革新を実行可能にすることで、この基本的な制約を揺るがす完全に自律的なシステムです。
従来のニューラルアーキテクチャサーチ(NAS)は、人間定義空間の探索に基本的に制限されており、自動最適化から自動イノベーションへのパラダイムシフトを導入しています。
ASI-Archは、アーキテクチャ発見の分野におけるエンドツーエンドの科学的研究を行い、新しいアーキテクチャ概念を自律的に仮説化し、実行可能なコードとして実装し、厳密な実験と過去の経験を通じてパフォーマンスを実証的に検証する。
ASI-Archは2万時間にわたって1,773の自律的な実験を行い、106の革新的で最先端の(SOTA)線形アテンションアーキテクチャを発見した。
AlphaGoのMove 37は、人間のプレーヤーに見えない予期せぬ戦略的洞察を明らかにしていますが、私たちのAIが発見したアーキテクチャは、人間の設計したベースラインを体系的に超越し、アーキテクチャ革新のためのこれまで未知の経路を照らす、創発的な設計原則を示しています。
重要なことに、我々は科学的発見のための最初の経験的スケーリング法を確立し、アーキテクチャのブレークスルーが計算的にスケール可能であることを実証し、研究の進歩を人間に制限されたプロセスから計算可能プロセスに変換する。
我々は、これらのブレークスルーを可能にした創発的なデザインパターンと自律的な研究能力の包括的な分析を行い、自己加速型AIシステムの青写真を確立します。
関連論文リスト
- AI-Driven Automation Can Become the Foundation of Next-Era Science of Science Research [58.944125758758936]
科学科学(Science of Science, SoS)は、科学的発見の基礎となるメカニズムを探求する。
人工知能(AI)の出現は、次世代のSoSに変革の機会をもたらす。
我々は、従来の手法よりもAIの利点を概説し、潜在的な制限について議論し、それらを克服するための経路を提案する。
論文 参考訳(メタデータ) (2025-05-17T15:01:33Z) - Personalized Artificial General Intelligence (AGI) via Neuroscience-Inspired Continuous Learning Systems [3.764721243654025]
現在のアプローチは、タスク固有のパフォーマンスを改善するが、継続的で適応性があり、一般化された学習を可能にするには不十分なモデルパラメータの拡張に大きく依存している。
本稿では、連続学習と神経科学に触発されたAIの現状を概観し、脳のような学習機構をエッジ展開に統合したパーソナライズされたAGIのための新しいアーキテクチャを提案する。
これらの洞察に基づいて、我々は、相補的な高速かつスローな学習モジュール、シナプス的自己最適化、デバイス上の寿命適応をサポートするためのメモリ効率のモデル更新を特徴とするAIアーキテクチャの概要を述べる。
論文 参考訳(メタデータ) (2025-04-27T16:10:17Z) - A Neuro-mimetic Realization of the Common Model of Cognition via Hebbian
Learning and Free Energy Minimization [55.11642177631929]
大規模なニューラル生成モデルは、意味的に豊富なテキストのパスを合成したり、複雑な画像を生成することができる。
我々はコモン・モデル・オブ・コグニティブ・ニューラル・ジェネレーティブ・システムについて論じる。
論文 参考訳(メタデータ) (2023-10-14T23:28:48Z) - The Future of Fundamental Science Led by Generative Closed-Loop
Artificial Intelligence [67.70415658080121]
機械学習とAIの最近の進歩は、技術革新、製品開発、社会全体を破壊している。
AIは、科学的な実践とモデル発見のための高品質なデータの大規模なデータセットへのアクセスがより困難であるため、基礎科学にはあまり貢献していない。
ここでは、科学的な発見に対するAI駆動、自動化、クローズドループアプローチの側面を調査し、調査する。
論文 参考訳(メタデータ) (2023-07-09T21:16:56Z) - An Initial Look at Self-Reprogramming Artificial Intelligence [0.0]
我々は、最初の完全自己プログラミングAIシステムを開発し、実験的に検証する。
AIベースのコンピュータコード生成をAI自体に適用することで、ニューラルネットワークのソースコードを継続的に修正し書き換えるアルゴリズムを実装します。
論文 参考訳(メタデータ) (2022-04-30T05:44:34Z) - Distributed and Democratized Learning: Philosophy and Research
Challenges [80.39805582015133]
民主化学習(Dem-AI)という新しいデザイン哲学を提案する。
ヒトの社会的グループに触発され、提案されたDem-AIシステムの学習エージェントの専門グループは階層構造で自己組織化され、より効率的に学習タスクを遂行する。
本稿では,様々な学際分野に触発された未来のDem-AIシステムを実現するためのガイドラインとして,参照設計を提案する。
論文 参考訳(メタデータ) (2020-03-18T08:45:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。