論文の概要: AIBuildAI-2: A Knowledge-Enhanced Agent for Automatically Building AI Models
- arxiv url: http://arxiv.org/abs/2605.27873v1
- Date: Wed, 27 May 2026 02:44:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.695717
- Title: AIBuildAI-2: A Knowledge-Enhanced Agent for Automatically Building AI Models
- Title(参考訳): AIBuildAI-2:AIモデルの自動構築のための知識強化エージェント
- Authors: Ruiyi Zhang, Peijia Qin, Qi Cao, Li Zhang, Pengtao Xie,
- Abstract要約: AIモデルは、画像やテキスト処理から生物学、物理学、化学における科学的発見まで、データ中心の応用を基盤としている。
しかし、それらの開発は依然として非常に手作業で行われており、実践者はアーキテクチャを設計し、トレーニングパイプラインを構築し、反復的にソリューションを洗練する必要がある。
本稿では,AIモデルを自動的に構築する外部進化型知識システムを備えた知識強化エージェントであるAIBuildAI-2を紹介する。
- 参考スコア(独自算出の注目度): 31.05147308924019
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: AI models underpin data-centric applications from image and text processing to scientific discovery in biology, physics, and chemistry. Yet developing them remains heavily manual, requiring practitioners to design architectures, build training pipelines, and iteratively refine solutions, making it challenging for natural scientists without specialized AI engineering expertise to build the high-performing models their research demands. To reduce this burden and broaden access to AI for scientific discovery, agents that automatically build AI models have been proposed. However, the performance of these agents is largely limited by the parametric knowledge of their underlying large language models, which is static, often outdated, and sparse on practical AI model engineering know-how. To address this limitation, we introduce AIBuildAI-2, a knowledge-enhanced agent with an external, evolving knowledge system for automatically building AI models. The knowledge system of AIBuildAI-2 is hierarchical, organizing curated AI development knowledge into high-level knowledge instructions over topical categories and low-level knowledge documents under each category, from which the agent dynamically loads only the context relevant to its current state and the AI task being solved, grounding each design and implementation decision in concrete, externally verifiable expertise. The system is initialized by collecting and cleaning AI-development-related documents from the web and organizing them into the corresponding categories, and continually evolves from the agent's own experience by distilling each completed run on an AI task into structured takeaways that are written back into the knowledge system. AIBuildAI-2 achieves state-of-the-art results, ranking first on MLE-Bench with a 70.7% medal rate and placing in the top 6.6% among 4,370 human-expert teams in a heart disease prediction competition.
- Abstract(参考訳): AIモデルは、画像やテキスト処理から生物学、物理学、化学における科学的発見まで、データ中心の応用を基盤としている。
しかし、それらの開発は依然として非常に手作業で行われており、実践者はアーキテクチャを設計し、トレーニングパイプラインを構築し、反復的にソリューションを洗練する必要がある。
この負担を軽減し、科学的な発見のためにAIへのアクセスを拡大するために、AIモデルを自動的に構築するエージェントが提案されている。
しかしながら、これらのエージェントのパフォーマンスは、静的で、しばしば時代遅れで、実用的なAIモデルのエンジニアリングノウハウに乏しい、基盤となる大きな言語モデルのパラメトリック知識によって大きく制限されている。
この制限に対処するために、AIモデルを自動的に構築する外部の進化した知識システムを備えた知識強化エージェントであるAIBuildAI-2を紹介する。
AIBuildAI-2の知識システムは階層的であり、AI開発知識をトピックのカテゴリと各カテゴリ下の低レベルの知識ドキュメント上のハイレベルな知識命令に整理し、エージェントがその状態とAIタスクに関連するコンテキストのみを動的にロードし、具体的かつ検証可能な専門知識で各設計と実装の決定を基礎付ける。
システムは、WebからAI開発関連の文書を収集し、それらを対応するカテゴリに整理することで初期化され、AIタスクの完了した各実行を、知識システムに書き戻された構造化されたテイクアウトに蒸留することで、エージェント自身の経験から継続的に進化する。
AIBuildAI-2は最先端の成果を達成し、MLE-Benchで70.7%のメダルを獲得し、心臓疾患予測競技の4,370チーム中6.6%にランクインした。
関連論文リスト
- AIBuildAI: An AI Agent for Automatically Building AI Models [31.05147308924019]
タスク記述とトレーニングデータからAIモデルを自動的に構築するAIエージェントであるAIBuildAIを紹介する。
我々は、リアルなKaggleスタイルのAI開発タスクのベンチマークであるMLE-Bench上でAIBuildAIを評価する。
論文 参考訳(メタデータ) (2026-04-15T22:17:05Z) - AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Agents with Cloud Computing Access [60.37646376282544]
本稿では,全検索ランキング研究パイプラインを自動化したAI共同科学者フレームワークを提案する。
これは、AIの共同科学者フレームワークをアルゴリズム研究に利用した、ランキングコミュニティで初めての研究である。
論文 参考訳(メタデータ) (2026-03-23T09:29:08Z) - Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery [81.03797680309154]
DBench-Bioは、AIの生物学的知識発見能力を評価するための、動的で完全に自動化されたベンチマークである。
このパイプラインをインスタンス化し、12のバイオメディカルサブドメインをカバーする月次更新ベンチマークを構築します。
我々の研究は、AIシステムの新しい知識発見能力を評価するための、最初の動的で自動的なフレームワークを提供する。
論文 参考訳(メタデータ) (2026-02-10T05:47:22Z) - Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.895981259683]
汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:11:31Z) - General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。
私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。
私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文 参考訳(メタデータ) (2025-03-09T01:13:56Z) - Compliance Cards: Automated EU AI Act Compliance Analyses amidst a Complex AI Supply Chain [9.991293429067065]
我々は、複雑なAIサプライチェーンの中で、プロバイダ側AIAコンプライアンス分析のための完全なシステムを導入する。
ひとつは、AIA固有のメタデータをキャプチャする、計算的でマルチステークホルダーの透明性アーティファクトのインターロックセットです。
第2のアルゴリズムは、AIシステムやモデルがAIAに準拠しているかどうかをリアルタイムで予測するアルゴリズムである。
論文 参考訳(メタデータ) (2024-06-20T22:07:15Z) - The Artificial Intelligence Ontology: LLM-assisted construction of AI concept hierarchies [0.7796141041639462]
人工知能オントロジー(AIO)は、人工知能の概念、方法論、それらの相互関係の体系化である。
AIOは、AI技術の技術的側面と倫理的側面の両方を含む包括的なフレームワークを提供することによって、急速に進化するAIの展望に対処することを目指している。
論文 参考訳(メタデータ) (2024-04-03T20:08:15Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - AI-in-the-Loop -- The impact of HMI in AI-based Application [0.0]
我々は,AIと人間の強みを組み合わせたループ型AIの概念を導入する。
AIを使用した推論でHMIを有効にすることで、AIと人間の強みを組み合わせた、ループ内のAIの概念を導入します。
論文 参考訳(メタデータ) (2023-03-21T00:04:33Z) - Automated Machine Learning: A Case Study on Non-Intrusive Appliance Load Monitoring [81.06807079998117]
非侵入的機器負荷モニタリング(NIALM)のための自動機械学習(AutoML)を実現する新しい手法を提案する。
NIALMは、電子機器や家電のエネルギー消費を測定するためのスマートメーターに代わる費用対効果を提供する。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。