論文の概要: GenoML: Automated Machine Learning for Genomics
- arxiv url: http://arxiv.org/abs/2103.03221v1
- Date: Thu, 4 Mar 2021 18:48:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 14:44:06.931324
- Title: GenoML: Automated Machine Learning for Genomics
- Title(参考訳): GenoML: ゲノムのための自動機械学習
- Authors: Mary B. Makarious, Hampton L. Leonard, Dan Vitale, Hirotaka Iwaki,
David Saffo, Lana Sargent, Anant Dadu, Eduardo Salmer\'on Casta\~no, John F.
Carter, Melina Maleknia, Juan A. Botia, Cornelis Blauwendraat, Roy H.
Campbell, Sayed Hadi Hashemi, Andrew B. Singleton, Mike A. Nalls, Faraz
Faghri
- Abstract要約: GenoMLは、ゲノミクス(遺伝学とマルチオミクス)のための機械学習を自動化するPythonパッケージである
GenoMLの使命は、非専門家にゲノム学と臨床データのための機械学習をもたらすことです。
- 参考スコア(独自算出の注目度): 3.2739205123864945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: GenoML is a Python package automating machine learning workflows for genomics
(genetics and multi-omics) with an open science philosophy. Genomics data
require significant domain expertise to clean, pre-process, harmonize and
perform quality control of the data. Furthermore, tuning, validation, and
interpretation involve taking into account the biology and possibly the
limitations of the underlying data collection, protocols, and technology.
GenoML's mission is to bring machine learning for genomics and clinical data to
non-experts by developing an easy-to-use tool that automates the full
development, evaluation, and deployment process. Emphasis is put on open
science to make workflows easily accessible, replicable, and transferable
within the scientific community. Source code and documentation is available at
https://genoml.com.
- Abstract(参考訳): GenoMLは、ゲノミクス(遺伝学とマルチオミクス)のための機械学習ワークフローを自動化するPythonパッケージである。
ゲノムデータには、データのクリーン化、前処理、調和、および品質管理を行うための重要なドメイン専門知識が必要です。
さらに、チューニング、検証、および解釈には、基礎となるデータ収集、プロトコル、および技術の生物学および潜在的に制限を考慮する必要があります。
GenoMLの使命は、完全な開発、評価、および展開プロセスを自動化する使いやすいツールを開発し、ゲノム学と臨床データの機械学習を非専門家にもたらすことです。
オープンサイエンスを重視して、ワークフローを科学コミュニティ内で簡単にアクセス、複製、転送できるようにします。
ソースコードとドキュメントはhttps://genoml.comで入手できる。
関連論文リスト
- Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Boolean matrix logic programming for active learning of gene functions in genome-scale metabolic network models [4.762323642506732]
我々は、細胞工学の促進と生物学的発見を促進するために、論理ベースの機械学習技術を適用しようとしている。
我々は,情報的実験を導くことでゲノム仮説空間を効率的に探索する新しいシステム,BMLP_active$を導入する。
$BMLP_active$は、ランダムな実験よりもトレーニング例が少ない遺伝子ペア間の相互作用をうまく学べる。
論文 参考訳(メタデータ) (2024-05-10T09:51:06Z) - EndToEndML: An Open-Source End-to-End Pipeline for Machine Learning Applications [0.2826977330147589]
機械学習モデルの事前処理、トレーニング、評価、可視化が可能なWebベースのエンドツーエンドパイプラインを提案する。
本ライブラリは,マルチモーダル・マルチセンサ・データセットの認識,分類,クラスタリング,および予測を支援する。
論文 参考訳(メタデータ) (2024-03-27T02:24:38Z) - Toward a Team of AI-made Scientists for Scientific Discovery from Gene
Expression Data [9.767546641019862]
我々は、科学的な発見パイプラインを合理化するために設計された新しいフレームワーク、AIマニュフェストチーム(TAIS)を紹介する。
TAISは、プロジェクトマネージャ、データエンジニア、ドメインエキスパートを含むシミュレートされた役割で構成され、それぞれがLLM(Large Language Model)によって表現される。
これらの役割は、典型的にはデータ科学者が行うタスクを再現するために協力し、疾患予測遺伝子を特定することに焦点を当てている。
論文 参考訳(メタデータ) (2024-02-15T06:30:12Z) - Machine learning in bioprocess development: From promise to practice [58.720142291102135]
機械学習(ML)アプローチのようなデータ駆動の手法は、大きな設計空間を合理的に探索する可能性が高い。
本研究の目的は,これまでのバイオプロセス開発におけるML手法の適用例を示すことである。
論文 参考訳(メタデータ) (2022-10-04T13:48:59Z) - When Bioprocess Engineering Meets Machine Learning: A Survey from the
Perspective of Automated Bioprocess Development [3.687740185234604]
機械学習(ML)はバイオプロセス工学の発展に大きく貢献しているが、その応用は限られている。
このレビューでは、バイオプロセス開発におけるMLベースの自動化の概要について概観する。
論文 参考訳(メタデータ) (2022-09-02T14:30:49Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Ten Quick Tips for Deep Learning in Biology [116.78436313026478]
機械学習は、データのパターンを認識し、予測モデリングに使用するアルゴリズムの開発と応用に関係している。
ディープラーニングは、独自の機械学習のサブフィールドになっている。
生物学的研究の文脈において、ディープラーニングは高次元の生物学的データから新しい洞察を導き出すためにますます使われてきた。
論文 参考訳(メタデータ) (2021-05-29T21:02:44Z) - Automated Biodesign Engineering by Abductive Meta-Interpretive Learning [8.788941848262786]
Abductive Meta-Interpretive Learning($Meta_Abd$)を活用した自動バイオデザインエンジニアリングフレームワークを提案します。
本稿では,Abductive Meta-Interpretive Learning(Meta_Abd$)を活用したバイオデザイン自動工学フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-17T12:10:26Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。