論文の概要: GeneDisco: A Benchmark for Experimental Design in Drug Discovery
- arxiv url: http://arxiv.org/abs/2110.11875v1
- Date: Fri, 22 Oct 2021 16:01:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 13:48:39.004850
- Title: GeneDisco: A Benchmark for Experimental Design in Drug Discovery
- Title(参考訳): GeneDisco: 薬物発見実験のためのベンチマーク
- Authors: Arash Mehrjou, Ashkan Soleymani, Andrew Jesson, Pascal Notin, Yarin
Gal, Stefan Bauer, Patrick Schwab
- Abstract要約: 遺伝子操作によるin vitro細胞実験は、早期の薬物発見における重要なステップである。
GeneDiscoは、薬物発見の実験的な設計のためのアクティブな学習アルゴリズムを評価するためのベンチマークスイートである。
- 参考スコア(独自算出の注目度): 41.6425999218259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In vitro cellular experimentation with genetic interventions, using for
example CRISPR technologies, is an essential step in early-stage drug discovery
and target validation that serves to assess initial hypotheses about causal
associations between biological mechanisms and disease pathologies. With
billions of potential hypotheses to test, the experimental design space for in
vitro genetic experiments is extremely vast, and the available experimental
capacity - even at the largest research institutions in the world - pales in
relation to the size of this biological hypothesis space. Machine learning
methods, such as active and reinforcement learning, could aid in optimally
exploring the vast biological space by integrating prior knowledge from various
information sources as well as extrapolating to yet unexplored areas of the
experimental design space based on available data. However, there exist no
standardised benchmarks and data sets for this challenging task and little
research has been conducted in this area to date. Here, we introduce GeneDisco,
a benchmark suite for evaluating active learning algorithms for experimental
design in drug discovery. GeneDisco contains a curated set of multiple publicly
available experimental data sets as well as open-source implementations of
state-of-the-art active learning policies for experimental design and
exploration.
- Abstract(参考訳): 例えばCRISPR技術を用いたin vitroでの細胞実験は、早期の薬物発見と標的検証において重要なステップであり、生物学的メカニズムと疾患の病態の間の因果関係に関する最初の仮説を評価するのに役立つ。
何十億という仮説が検証される中、in vitroの遺伝子実験のための実験的な設計スペースは非常に広く、利用可能な実験能力(世界最大の研究機関でも)は、この生物学的仮説空間の大きさと関係している。
アクティブ学習や強化学習のような機械学習手法は、様々な情報ソースからの事前知識を統合し、利用可能なデータに基づいて実験的な設計空間の未探索領域に外挿することで、広大な生物空間を最適に探索するのに役立つ。
しかし、この課題に対して標準化されたベンチマークやデータセットは存在せず、この分野ではこれまでほとんど研究されていない。
本稿では,薬物発見実験のためのアクティブラーニングアルゴリズムを評価するベンチマークスイートであるGeneDiscoを紹介する。
GeneDiscoには、複数の公開実験データセットのキュレートされたセットと、実験設計と探索のための最先端のアクティブラーニングポリシーのオープンソース実装が含まれている。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - A large dataset curation and benchmark for drug target interaction [0.7699646945563469]
生物活性データは、薬物の発見と再資源化において重要な役割を担っている。
複数の公開ソースからキュレートされた非常に大きなデータセットを標準化し、効率的に表現する方法を提案する。
論文 参考訳(メタデータ) (2024-01-30T17:06:25Z) - DiscoBAX: Discovery of Optimal Intervention Sets in Genomic Experiment
Design [61.48963555382729]
本研究では,実験1回あたりの有意な発見率を最大化するためのサンプル効率向上手法としてDiscoBAXを提案する。
我々は、標準仮定の下で近似最適性の理論的保証を提供し、包括的な実験評価を行う。
論文 参考訳(メタデータ) (2023-12-07T06:05:39Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - Pitfalls in Experiments with DNN4SE: An Analysis of the State of the
Practice [0.7614628596146599]
我々は、ソフトウェアエンジニアリングのプレミア会場で発行された55の論文に現れるディープニューラルネットワークに依存する技術を用いて、194の実験を行い、マッピング研究を実施します。
以上の結果から,ACMアーティファクトバッジを受信した者を含む実験の大部分が,その信頼性に疑問を呈する根本的な限界があることが判明した。
論文 参考訳(メタデータ) (2023-05-19T09:55:48Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - Targeted active learning for probabilistic models [8.615625517708324]
科学における基本的な課題は、研究中のシステムに関する貴重な洞察を得る実験を設計することである。
PDBALは,科学的有用性を最大化するために実験を適応的に設計する能動学習手法である。
論文 参考訳(メタデータ) (2022-10-21T17:22:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。