論文の概要: AIDE: AI-Driven Exploration in the Space of Code
- arxiv url: http://arxiv.org/abs/2502.13138v1
- Date: Tue, 18 Feb 2025 18:57:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 20:12:09.14553
- Title: AIDE: AI-Driven Exploration in the Space of Code
- Title(参考訳): AIDE: コード空間におけるAI駆動の探索
- Authors: Zhengyao Jiang, Dominik Schmidt, Dhruv Srikanth, Dixing Xu, Ian Kaplan, Deniss Jacenko, Yuxiang Wu,
- Abstract要約: 大規模言語モデル(LLM)を利用した機械学習エンジニアリングエージェントであるAI-Driven Exploration(AIDE)を紹介する。
AIDEは、コード最適化問題として機械学習エンジニアリングをフレーム化し、潜在的なソリューションの空間におけるツリーサーチとして試行錯誤を定式化する。
有望なソリューションを戦略的に再利用し、精製することにより、AIDEは計算資源を効果的に取引し、性能を向上する。
- 参考スコア(独自算出の注目度): 6.401493599308353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning, the foundation of modern artificial intelligence, has driven innovations that have fundamentally transformed the world. Yet, behind advancements lies a complex and often tedious process requiring labor and compute intensive iteration and experimentation. Engineers and scientists developing machine learning models spend much of their time on trial-and-error tasks instead of conceptualizing innovative solutions or research hypotheses. To address this challenge, we introduce AI-Driven Exploration (AIDE), a machine learning engineering agent powered by large language models (LLMs). AIDE frames machine learning engineering as a code optimization problem, and formulates trial-and-error as a tree search in the space of potential solutions. By strategically reusing and refining promising solutions, AIDE effectively trades computational resources for enhanced performance, achieving state-of-the-art results on multiple machine learning engineering benchmarks, including our Kaggle evaluations, OpenAI MLE-Bench and METRs RE-Bench.
- Abstract(参考訳): 現代の人工知能の基盤である機械学習は、世界を根本的に変えたイノベーションを推進してきた。
しかし、進歩の裏には、複雑な、しばしば退屈なプロセスがあり、労働と計算集約的なイテレーションと実験が必要です。
機械学習モデルを開発するエンジニアや科学者は、革新的なソリューションや研究仮説を概念化する代わりに、試行錯誤タスクに多くの時間を費やす。
この課題に対処するために,大規模言語モデル(LLM)を利用した機械学習エンジニアリングエージェントであるAI-Driven Exploration(AIDE)を紹介した。
AIDEは、コード最適化問題として機械学習エンジニアリングをフレーム化し、潜在的なソリューションの空間におけるツリーサーチとして試行錯誤を定式化する。
AIDEは、有望なソリューションの戦略的再利用と精錬によって、パフォーマンス向上のために計算資源を効果的に交換し、Kaggleの評価、OpenAI MLE-Bench、METRs RE-Benchを含む、複数の機械学習エンジニアリングベンチマークで最先端の結果を達成する。
関連論文リスト
- Personalized Artificial General Intelligence (AGI) via Neuroscience-Inspired Continuous Learning Systems [3.764721243654025]
現在のアプローチは、タスク固有のパフォーマンスを改善するが、継続的で適応性があり、一般化された学習を可能にするには不十分なモデルパラメータの拡張に大きく依存している。
本稿では、連続学習と神経科学に触発されたAIの現状を概観し、脳のような学習機構をエッジ展開に統合したパーソナライズされたAGIのための新しいアーキテクチャを提案する。
これらの洞察に基づいて、我々は、相補的な高速かつスローな学習モジュール、シナプス的自己最適化、デバイス上の寿命適応をサポートするためのメモリ効率のモデル更新を特徴とするAIアーキテクチャの概要を述べる。
論文 参考訳(メタデータ) (2025-04-27T16:10:17Z) - Speeding up design and making to reduce time-to-project and time-to-market: an AI-Enhanced approach in engineering education [0.0]
本稿では、組み込みシステムのためのソフトウェアアーキテクチャコースにおいて、ChatGPTやGitHub CopilotといったAIツールの統合について検討する。
その結果、AIが強化されるが、人間の意思決定に取って代わるものではないため、問題解決、より高速な開発、より高度な成果が実証された。
論文 参考訳(メタデータ) (2025-03-20T16:32:13Z) - MLGym: A New Framework and Benchmark for Advancing AI Research Agents [51.9387884953294]
我々はMeta MLGymとMLGym-Benchを紹介した。これはAI研究タスクにおける大規模言語モデルの評価と開発のための新しいフレームワークとベンチマークである。
これは機械学習(ML)タスクのための最初のGym環境であり、そのようなエージェントをトレーニングするための強化学習(RL)アルゴリズムの研究を可能にする。
我々は、Claude-3.5-Sonnet、Llama-3.1 405B、GPT-4o、o1-preview、Gemini-1.5 Proなどのベンチマークで、多くのフロンティア大言語モデル(LLM)を評価した。
論文 参考訳(メタデータ) (2025-02-20T12:28:23Z) - Retrieval-Augmented Instruction Tuning for Automated Process Engineering Calculations : A Tool-Chaining Problem-Solving Framework with Attributable Reflection [0.0]
オープンでカスタマイズ可能な小型コード言語モデル(SLM)を強化するためにRAIT(Retrieval-Augmented Instruction-Tuning)を活用する新しい自律エージェントフレームワークを提案する。
命令チューニングされたコードSLMと外部ツールを使用してRACG(Retrieval-Augmented Code Generation)を組み合わせることで、エージェントは自然言語仕様からコードを生成し、デバッグし、最適化する。
我々のアプローチは、専門的なプロセスエンジニアリングタスクのための基礎的AIモデルの欠如の限界に対処し、説明可能性、知識編集、費用対効果の利点を提供する。
論文 参考訳(メタデータ) (2024-08-28T15:33:47Z) - AutoTRIZ: Artificial Ideation with TRIZ and Large Language Models [2.7624021966289605]
発明的問題解決の理論は、体系的なイノベーションに広く適用されている。
TRIZリソースと概念の複雑さは、ユーザの知識、経験、推論能力への依存と相まって、実用性を制限する。
提案するAutoTRIZは,LPMを用いてTRIZ手法を自動化・拡張する人工的思考ツールである。
論文 参考訳(メタデータ) (2024-03-13T02:53:36Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - The Future of Fundamental Science Led by Generative Closed-Loop
Artificial Intelligence [67.70415658080121]
機械学習とAIの最近の進歩は、技術革新、製品開発、社会全体を破壊している。
AIは、科学的な実践とモデル発見のための高品質なデータの大規模なデータセットへのアクセスがより困難であるため、基礎科学にはあまり貢献していない。
ここでは、科学的な発見に対するAI駆動、自動化、クローズドループアプローチの側面を調査し、調査する。
論文 参考訳(メタデータ) (2023-07-09T21:16:56Z) - OpenAGI: When LLM Meets Domain Experts [51.86179657467822]
ヒューマン・インテリジェンス(HI)は、複雑なタスクを解くための基本的なスキルの組み合わせに長けている。
この機能は人工知能(AI)にとって不可欠であり、包括的なAIエージェントに組み込まれるべきである。
マルチステップで現実的なタスクを解決するために設計されたオープンソースのプラットフォームであるOpenAGIを紹介します。
論文 参考訳(メタデータ) (2023-04-10T03:55:35Z) - Selected Trends in Artificial Intelligence for Space Applications [69.3474006357492]
この章は、差別化可能なインテリジェンスとオンボード機械学習に焦点を当てている。
欧州宇宙機関(ESA)Advanced Concepts Team(ACT)から選ばれたいくつかのプロジェクトについて論じる。
論文 参考訳(メタデータ) (2022-12-10T07:49:50Z) - Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。
特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z) - Flashlight: Enabling Innovation in Tools for Machine Learning [50.63188263773778]
私たちは、機械学習ツールやシステムの革新を促進するために構築されたオープンソースのライブラリであるFlashlightを紹介します。
Flashlightは、広く使われているライブラリを下流で活用し、機械学習とシステム研究者をより緊密に連携させる研究を可能にするツールだと考えています。
論文 参考訳(メタデータ) (2022-01-29T01:03:29Z) - Agility in Software 2.0 -- Notebook Interfaces and MLOps with Buttresses
and Rebars [9.327920030279586]
本稿では,機械学習開発の基本となる2つの現代的発展現象について論じる。
まず、統合開発環境への容易な移行をサポートすることにより、ノートブックにおける作業の本質的な弱点を解消できるソリューションを提案する。
第2に、MLOpsコンテキストにメタファ的な執着と残響を導入することで、AIシステムの強化エンジニアリングを提案する。
論文 参考訳(メタデータ) (2021-11-28T13:40:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。