論文の概要: Mining Documentation to Extract Hyperparameter Schemas
- arxiv url: http://arxiv.org/abs/2006.16984v2
- Date: Thu, 2 Jul 2020 21:04:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 05:19:56.185987
- Title: Mining Documentation to Extract Hyperparameter Schemas
- Title(参考訳): ハイパーパラメータスキーマ抽出のためのマイニングドキュメント
- Authors: Guillaume Baudart, Peter D. Kirchner, Martin Hirzel, Kiran Kate
- Abstract要約: 本稿では,Pythonのドクストリングを自動的にAIライブラリにマイニングしてハイパーパラメータを抽出する方法について述べる。
119変圧器と推定器のアプローチを評価し,機械可読スキーマの抽出に有効であることを確認した。
私たちのビジョンは、AI自動化ツール用のこのようなスキーマを手作業で作成およびメンテナンスし、より大きなライブラリやよりリッチなスキーマに自動化の到達範囲を広げることです。
- 参考スコア(独自算出の注目度): 2.3594022792521163
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI automation tools need machine-readable hyperparameter schemas to define
their search spaces. At the same time, AI libraries often come with good
human-readable documentation. While such documentation contains most of the
necessary information, it is unfortunately not ready to consume by tools. This
paper describes how to automatically mine Python docstrings in AI libraries to
extract JSON Schemas for their hyperparameters. We evaluate our approach on 119
transformers and estimators from three different libraries and find that it is
effective at extracting machine-readable schemas. Our vision is to reduce the
burden to manually create and maintain such schemas for AI automation tools and
broaden the reach of automation to larger libraries and richer schemas.
- Abstract(参考訳): ai自動化ツールは、検索空間を定義するために機械可読なハイパーパラメータスキーマを必要とする。
同時に、AIライブラリには、優れた人間可読性ドキュメントが付属することが多い。
このようなドキュメントには必要な情報の大半が含まれているが、残念ながらツールを使う準備ができていない。
本稿では,aiライブラリ内のpython docstringを自動マイニングしてハイパーパラメータ用のjsonスキーマを抽出する方法について述べる。
3つの異なるライブラリから119個のトランスフォーマーと推定器のアプローチを評価し,機械可読スキーマの抽出に有効であることを確認した。
私たちのビジョンは、AI自動化ツール用のこのようなスキーマを手作業で作成およびメンテナンスし、より大きなライブラリやよりリッチなスキーマに自動化の範囲を広げることです。
関連論文リスト
- pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文 参考訳(メタデータ) (2024-03-12T16:46:54Z) - HyperPIE: Hyperparameter Information Extraction from Scientific
Publications [5.4141465747474475]
我々は,ハイパーパラメータ情報抽出(HyperPIE)をエンティティ認識および関係抽出タスクとして形式化し,課題に取り組む。
微調整モデルに対しては,最先端のベースラインよりも29%のF1を向上する関係抽出手法を開発した。
大規模言語モデルでは,構造化データよりも,エンティティ認識における平均5.5%のF1向上を実現するYAMLを活用するアプローチを開発する。
論文 参考訳(メタデータ) (2023-12-17T07:39:07Z) - Large Language Models for Automated Data Science: Introducing CAAFE for
Context-Aware Automated Feature Engineering [52.09178018466104]
データセットのセマンティックな特徴を生成するために、コンテキスト認識自動特徴工学(CAAFE)を導入する。
方法論的には単純だが、CAAFEは14のデータセットのうち11のパフォーマンスを改善している。
我々は,AutoMLシステムの範囲をセマンティックなAutoMLに拡張できるコンテキスト認識ソリューションの重要性を強調した。
論文 参考訳(メタデータ) (2023-05-05T09:58:40Z) - AutoML-GPT: Automatic Machine Learning with GPT [74.30699827690596]
本稿では,タスク指向のプロンプトを開発し,大規模言語モデル(LLM)を自動的に活用して学習パイプラインを自動化することを提案する。
本稿では,多様なAIモデルのブリッジとしてGPTを用いたAutoML-GPTを提案する。
このアプローチはコンピュータビジョン、自然言語処理、その他の課題領域において顕著な結果をもたらす。
論文 参考訳(メタデータ) (2023-05-04T02:09:43Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - PyGlove: Symbolic Programming for Automated Machine Learning [88.15565138144042]
シンボリックプログラミングに基づくAutoMLの新しいプログラミング方法を紹介します。
このパラダイムでは、MLプログラムは変更可能であるため、他のプログラムで簡単に操作できます。
PyGloveユーザーは、静的プログラムを検索空間に簡単に変換し、検索空間と検索アルゴリズムをすばやく繰り返し、複雑な検索フローを作成できることを示しています。
論文 参考訳(メタデータ) (2021-01-21T19:05:44Z) - Scaling Systematic Literature Reviews with Machine Learning Pipelines [57.82662094602138]
体系的なレビューは、科学的文書からデータを抽出する。
これらの側面をそれぞれ自動化するパイプラインを構築し、多くの人間時間対システム品質トレードオフを実験します。
人間の専門的アノテーションの2週間だけで、パイプラインシステム全体の驚くほどの精度と一般性が得られることが分かりました。
論文 参考訳(メタデータ) (2020-10-09T16:19:42Z) - Lale: Consistent Automated Machine Learning [7.972562716069225]
Laleは、自動化された機械学習を一貫した方法で単純化し統一する、ハイレベルなPythonインターフェースのライブラリである。
本稿では,自動機械学習を一貫した方法で単純化・統一する,ハイレベルPythonインタフェースのライブラリであるLaleを紹介する。
論文 参考訳(メタデータ) (2020-07-04T00:55:41Z) - MANGO: A Python Library for Parallel Hyperparameter Tuning [4.728291880913813]
Mangoは並列ハイパーパラメータチューニングのためのPythonライブラリである。
Mangoは任意の分散スケジューリングフレームワークの使用を可能にする。
インテリジェントな並列検索戦略を実装し、豊富な抽象化を提供する。
論文 参考訳(メタデータ) (2020-05-22T20:58:26Z) - DriveML: An R Package for Driverless Machine Learning [7.004573941239386]
DriveMLは、自動機械学習パイプラインのいくつかの柱の実装を支援する。
DriveMLの主な利点は、開発時間の節約、開発者のエラー低減、マシンラーニングモデルとエラーの最適チューニングである。
論文 参考訳(メタデータ) (2020-05-01T16:40:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。