論文の概要: mlf-core: a framework for deterministic machine learning
- arxiv url: http://arxiv.org/abs/2104.07651v1
- Date: Thu, 15 Apr 2021 17:58:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 16:13:25.406462
- Title: mlf-core: a framework for deterministic machine learning
- Title(参考訳): mlf-core: 決定論的機械学習のためのフレームワーク
- Authors: Lukas Heumos, Philipp Ehmele, Kevin Menden, Luis Kuhn Cuellar, Edmund
Miller, Steffen Lemke, Gisela Gabernet and Sven Nahnsen
- Abstract要約: 主要な機械学習ライブラリは、原子操作に基づく非決定論的アルゴリズムの使用をデフォルトとする。
この欠点を克服するために、様々な機械学習ライブラリは非決定論的アルゴリズムの決定論的なものをリリースした。
我々は、これらの要件を満たし維持するための機械学習プロジェクトを支援する、新しいソフトウェアソリューションであるmlf-coreを開発した。
- 参考スコア(独自算出の注目度): 0.08795040582681389
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Machine learning has shown extensive growth in recent years. However,
previously existing studies highlighted a reproducibility crisis in machine
learning. The reasons for irreproducibility are manifold. Major machine
learning libraries default to the usage of non-deterministic algorithms based
on atomic operations. Solely fixing all random seeds is not sufficient for
deterministic machine learning. To overcome this shortcoming, various machine
learning libraries released deterministic counterparts to the non-deterministic
algorithms. We evaluated the effect of these algorithms on determinism and
runtime. Based on these results, we formulated a set of requirements for
reproducible machine learning and developed a new software solution, the
mlf-core ecosystem, which aids machine learning projects to meet and keep these
requirements. We applied mlf-core to develop fully reproducible models in
various biomedical fields including a single cell autoencoder with TensorFlow,
a PyTorch-based U-Net model for liver-tumor segmentation in CT scans, and a
liver cancer classifier based on gene expression profiles with XGBoost.
- Abstract(参考訳): 機械学習は近年大きく成長している。
しかし、これまでの研究では、機械学習における再現可能性の危機が強調されていた。
不再現性の理由は多様体である。
主要な機械学習ライブラリは、原子操作に基づく非決定論的アルゴリズムの使用をデフォルトとする。
すべてのランダムな種を固定するだけでは、決定論的機械学習には不十分である。
この欠点を克服するため、さまざまな機械学習ライブラリが非決定論的アルゴリズムと同等の決定論的アルゴリズムをリリースした。
これらのアルゴリズムが決定性と実行に与える影響を評価した。
これらの結果をもとに,再現可能な機械学習のための要件セットを定式化し,これらの要件を満たし維持するための機械学習プロジェクトを支援する,新たなソフトウェアソリューションであるmlf-core ecosystemを開発した。
tensorflowを用いた単一細胞オートエンコーダ,ctスキャンによる肝腫瘍分離のためのpytorchベースのu-netモデル,xgboostを用いた遺伝子発現プロファイルに基づく肝癌分類器など,mlf-coreを用いた生体医学分野の完全な再現性モデルの開発を行った。
関連論文リスト
- The Impact of Ontology on the Prediction of Cardiovascular Disease Compared to Machine Learning Algorithms [0.0]
本稿では,最も顕著な機械学習アルゴリズムと,オントロジーに基づく機械学習分類を比較し,レビューする。
これらの結果は, F-Measure, Accuracy, Recall, Precision などの混乱行列から生成された評価値を用いて評価した。
論文 参考訳(メタデータ) (2024-05-30T18:40:27Z) - Gradients of Functions of Large Matrices [18.361820028457718]
数値線形代数のワークホースを効率的に区別する方法を示す。
以前は知られていなかったLanczosとArnoldiのイテレーションのアジョイントシステムをJAXで実装し、結果として得られるコードがDiffraxと競合することを示す。
これらはすべて、問題固有のコードの最適化なしに実現されます。
論文 参考訳(メタデータ) (2024-05-27T15:39:45Z) - Using Machine Learning To Identify Software Weaknesses From Software
Requirement Specifications [49.1574468325115]
本研究は、要求仕様からソフトウェア弱点を特定するための効率的な機械学習アルゴリズムを見つけることに焦点を当てる。
ProMISE_exp. Naive Bayes、サポートベクターマシン(SVM)、決定木、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)アルゴリズムをテストした。
論文 参考訳(メタデータ) (2023-08-10T13:19:10Z) - Automating In-Network Machine Learning [2.857025628729502]
Planterは、トレーニングされた機械学習モデルをプログラム可能なデバイスにマッピングするためのオープンソースのフレームワークである。
ネットワーク内機械学習アルゴリズムは,回線レートで動作し,レイテンシへの影響を無視し,標準スイッチング機能と共存し,精度のトレードオフがないことを示す。
論文 参考訳(メタデータ) (2022-05-18T09:42:22Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Ten Quick Tips for Deep Learning in Biology [116.78436313026478]
機械学習は、データのパターンを認識し、予測モデリングに使用するアルゴリズムの開発と応用に関係している。
ディープラーニングは、独自の機械学習のサブフィールドになっている。
生物学的研究の文脈において、ディープラーニングは高次元の生物学的データから新しい洞察を導き出すためにますます使われてきた。
論文 参考訳(メタデータ) (2021-05-29T21:02:44Z) - Reservoir Stack Machines [77.12475691708838]
メモリ拡張ニューラルネットワークは、情報ストレージを必要とするタスクをサポートするために、明示的なメモリを備えたリカレントニューラルネットワークを備える。
本研究では,全ての決定論的文脈自由言語を確実に認識できるモデルである貯水池スタックマシンを導入する。
以上の結果から, 貯水池スタックマシンは, 訓練データよりも長い試験シーケンスでもゼロ誤差を達成できることがわかった。
論文 参考訳(メタデータ) (2021-05-04T16:50:40Z) - Soft Genetic Programming Binary Classifiers [0.0]
ソフト」遺伝的プログラミング(SGP)が開発され、論理演算木はより柔軟になり、データセットに依存性を見出すことができる。
本稿では,SGP手法を用いたバイナリ分類器の構成法について述べる。
論文 参考訳(メタデータ) (2021-01-21T17:43:11Z) - Predictive Coding Approximates Backprop along Arbitrary Computation
Graphs [68.8204255655161]
我々は、コア機械学習アーキテクチャを予測的符号化に翻訳する戦略を開発する。
私たちのモデルは、挑戦的な機械学習ベンチマークのバックプロップと同等に機能します。
本手法は,ニューラルネットワークに標準機械学習アルゴリズムを直接実装できる可能性を高める。
論文 参考訳(メタデータ) (2020-06-07T15:35:47Z) - Towards automated kernel selection in machine learning systems: A SYCL
case study [0.0]
本稿では,ライブラリに高性能なSYCLカーネルをデプロイするケーススタディにおいて,機械学習を用いてカーネルの選択を行う。
自動チューニングと機械学習を組み合わせることで、これらのカーネル選択プロセスは、新しいハードウェアで高いパフォーマンスを達成するための開発者の努力をほとんど必要とせずにデプロイできる。
論文 参考訳(メタデータ) (2020-03-15T11:23:36Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。