論文の概要: Procedural Generation of Algorithm Discovery Tasks in Machine Learning
- arxiv url: http://arxiv.org/abs/2603.17863v1
- Date: Wed, 18 Mar 2026 15:49:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.806207
- Title: Procedural Generation of Algorithm Discovery Tasks in Machine Learning
- Title(参考訳): 機械学習におけるアルゴリズム発見タスクの手続き生成
- Authors: Alexander D. Goldie, Zilin Wang, Adrian Hayler, Deepak Nathani, Edan Toledo, Ken Thampiratwong, Aleksandra Kalisz, Michael Beukman, Alistair Letcher, Shashank Reddy, Clarisse Wibault, Theo Wolf, Charles O'Neill, Uljad Berdica, Nicholas Roberts, Saeed Rahmani, Hannah Erlebach, Roberta Raileanu, Shimon Whiteson, Jakob N. Foerster,
- Abstract要約: DiscoGenは、機械学習のためのアルゴリズム発見タスクの手続き的ジェネレータである。
それは、さまざまな機械学習分野から、さまざまな困難と複雑さの数百万のタスクにまたがる。
本稿では、ADAの原理的評価のために、DiscoGenタスクの固定された小さなサブセットからなるベンチマークを示す。
- 参考スコア(独自算出の注目度): 87.89048339690163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automating the development of machine learning algorithms has the potential to unlock new breakthroughs. However, our ability to improve and evaluate algorithm discovery systems has thus far been limited by existing task suites. They suffer from many issues, such as: poor evaluation methodologies; data contamination; and containing saturated or very similar problems. Here, we introduce DiscoGen, a procedural generator of algorithm discovery tasks for machine learning, such as developing optimisers for reinforcement learning or loss functions for image classification. Motivated by the success of procedural generation in reinforcement learning, DiscoGen spans millions of tasks of varying difficulty and complexity from a range of machine learning fields. These tasks are specified by a small number of configuration parameters and can be used to optimise algorithm discovery agents (ADAs). We present DiscoBench, a benchmark consisting of a fixed, small subset of DiscoGen tasks for principled evaluation of ADAs. Finally, we propose a number of ambitious, impactful research directions enabled by DiscoGen, in addition to experiments demonstrating its use for prompt optimisation of an ADA. DiscoGen is released open-source at https://github.com/AlexGoldie/discogen.
- Abstract(参考訳): 機械学習アルゴリズムの開発を自動化することは、新たなブレークスルーを解き放つ可能性がある。
しかし,アルゴリズム発見システムの改良と評価は,既存のタスクスイートによって制限されている。
評価方法の貧弱、データの汚染、飽和状態や非常に類似した問題を含むなど、多くの問題に悩まされている。
本稿では、強化学習のためのオプティマイザの開発や、画像分類のためのロス関数の開発など、機械学習のためのアルゴリズム発見タスクの手続き的生成であるDiscoGenを紹介する。
強化学習における手続き生成の成功に動機づけられたDiscoGenは、さまざまな機械学習分野からさまざまな困難と複雑さの何百万ものタスクにまたがる。
これらのタスクは、少数の設定パラメータによって指定され、アルゴリズム発見エージェント(ADA)の最適化に使用できる。
本稿では、ADAの原理的評価のために、DiscoGenタスクの固定された小さなサブセットからなるベンチマークであるDiscoBenchを紹介する。
最後に、DiscoGenが実現した多くの野心的でインパクトに富んだ研究の方向性と、ADAの迅速な最適化を実証する実験を提案する。
DiscoGenはhttps://github.com/AlexGoldie/discogen.comでオープンソースとしてリリースされた。
関連論文リスト
- SciML Agents: Write the Solver, Not the Solution [69.5021018644143]
敵の"ミスリーディング"問題の診断データセットと,1,000種類のODEタスクの大規模ベンチマークという,2つの新しいデータセットを紹介した。
オープンおよびクローズドソース LLM モデルについて, (i) 誘導型とガイド型, (ii) オフ・ザ・シェルフ対微調整型という2つの軸に沿って評価した。
予備的な結果は、慎重なプロンプトと微調整により、単純なODE問題を確実に解決できる特殊なLLMエージェントが得られることを示唆している。
論文 参考訳(メタデータ) (2025-09-12T02:53:57Z) - Generative Modeling for Mathematical Discovery [0.19791587637442667]
そこで本研究では,その遺伝子アルゴリズムの新たな実装について述べる。
我々の目的は数学者への関心の例を作成することである。
機械学習や高性能コンピューティングリソースへのアクセスに関する専門知識は必要ない。
論文 参考訳(メタデータ) (2025-03-14T03:54:43Z) - The Clock and the Pizza: Two Stories in Mechanistic Explanation of
Neural Networks [59.26515696183751]
ニューラルネットワークにおけるアルゴリズム発見は、時としてより複雑であることを示す。
単純な学習問題でさえ、驚くほど多様なソリューションを許容できることが示されています。
論文 参考訳(メタデータ) (2023-06-30T17:59:13Z) - Generative and reproducible benchmarks for comprehensive evaluation of
machine learning classifiers [6.605210393590192]
Diverse and GENerative ML Benchmark (DIGEN)は、機械学習アルゴリズムのベンチマークのための合成データセットの集合である。
詳細なドキュメンテーションと分析を備えたリソースはオープンソースであり、GitHubで公開されている。
論文 参考訳(メタデータ) (2021-07-14T03:58:02Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Discovering Reinforcement Learning Algorithms [53.72358280495428]
強化学習アルゴリズムは、いくつかのルールの1つに従ってエージェントのパラメータを更新する。
本稿では,更新ルール全体を検出するメタラーニング手法を提案する。
これには、一連の環境と対話することで、"何を予測するか"(例えば、値関数)と"どのように学習するか"の両方が含まれている。
論文 参考訳(メタデータ) (2020-07-17T07:38:39Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。