論文の概要: GeneDisco: A Benchmark for Experimental Design in Drug Discovery
- arxiv url: http://arxiv.org/abs/2110.11875v1
- Date: Fri, 22 Oct 2021 16:01:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 13:48:39.004850
- Title: GeneDisco: A Benchmark for Experimental Design in Drug Discovery
- Title(参考訳): GeneDisco: 薬物発見実験のためのベンチマーク
- Authors: Arash Mehrjou, Ashkan Soleymani, Andrew Jesson, Pascal Notin, Yarin
Gal, Stefan Bauer, Patrick Schwab
- Abstract要約: 遺伝子操作によるin vitro細胞実験は、早期の薬物発見における重要なステップである。
GeneDiscoは、薬物発見の実験的な設計のためのアクティブな学習アルゴリズムを評価するためのベンチマークスイートである。
- 参考スコア(独自算出の注目度): 41.6425999218259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In vitro cellular experimentation with genetic interventions, using for
example CRISPR technologies, is an essential step in early-stage drug discovery
and target validation that serves to assess initial hypotheses about causal
associations between biological mechanisms and disease pathologies. With
billions of potential hypotheses to test, the experimental design space for in
vitro genetic experiments is extremely vast, and the available experimental
capacity - even at the largest research institutions in the world - pales in
relation to the size of this biological hypothesis space. Machine learning
methods, such as active and reinforcement learning, could aid in optimally
exploring the vast biological space by integrating prior knowledge from various
information sources as well as extrapolating to yet unexplored areas of the
experimental design space based on available data. However, there exist no
standardised benchmarks and data sets for this challenging task and little
research has been conducted in this area to date. Here, we introduce GeneDisco,
a benchmark suite for evaluating active learning algorithms for experimental
design in drug discovery. GeneDisco contains a curated set of multiple publicly
available experimental data sets as well as open-source implementations of
state-of-the-art active learning policies for experimental design and
exploration.
- Abstract(参考訳): 例えばCRISPR技術を用いたin vitroでの細胞実験は、早期の薬物発見と標的検証において重要なステップであり、生物学的メカニズムと疾患の病態の間の因果関係に関する最初の仮説を評価するのに役立つ。
何十億という仮説が検証される中、in vitroの遺伝子実験のための実験的な設計スペースは非常に広く、利用可能な実験能力(世界最大の研究機関でも)は、この生物学的仮説空間の大きさと関係している。
アクティブ学習や強化学習のような機械学習手法は、様々な情報ソースからの事前知識を統合し、利用可能なデータに基づいて実験的な設計空間の未探索領域に外挿することで、広大な生物空間を最適に探索するのに役立つ。
しかし、この課題に対して標準化されたベンチマークやデータセットは存在せず、この分野ではこれまでほとんど研究されていない。
本稿では,薬物発見実験のためのアクティブラーニングアルゴリズムを評価するベンチマークスイートであるGeneDiscoを紹介する。
GeneDiscoには、複数の公開実験データセットのキュレートされたセットと、実験設計と探索のための最先端のアクティブラーニングポリシーのオープンソース実装が含まれている。
関連論文リスト
- Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Large Language Models as Biomedical Hypothesis Generators: A Comprehensive Evaluation [15.495976478018264]
大規模言語モデル(LLM)は、知識相互作用に革命をもたらす有望なツールとして登場した。
バイオメディカル文献から背景と仮説のペアのデータセットを構築し、トレーニング、観察、および見えないテストセットに分割する。
最上位モデルの仮説生成能力を、ゼロショット、少数ショット、微調整設定で評価する。
論文 参考訳(メタデータ) (2024-07-12T02:55:13Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - A large dataset curation and benchmark for drug target interaction [0.7699646945563469]
生物活性データは、薬物の発見と再資源化において重要な役割を担っている。
複数の公開ソースからキュレートされた非常に大きなデータセットを標準化し、効率的に表現する方法を提案する。
論文 参考訳(メタデータ) (2024-01-30T17:06:25Z) - DiscoBAX: Discovery of Optimal Intervention Sets in Genomic Experiment
Design [61.48963555382729]
本研究では,実験1回あたりの有意な発見率を最大化するためのサンプル効率向上手法としてDiscoBAXを提案する。
我々は、標準仮定の下で近似最適性の理論的保証を提供し、包括的な実験評価を行う。
論文 参考訳(メタデータ) (2023-12-07T06:05:39Z) - Pitfalls in Experiments with DNN4SE: An Analysis of the State of the
Practice [0.7614628596146599]
我々は、ソフトウェアエンジニアリングのプレミア会場で発行された55の論文に現れるディープニューラルネットワークに依存する技術を用いて、194の実験を行い、マッピング研究を実施します。
以上の結果から,ACMアーティファクトバッジを受信した者を含む実験の大部分が,その信頼性に疑問を呈する根本的な限界があることが判明した。
論文 参考訳(メタデータ) (2023-05-19T09:55:48Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - Targeted active learning for probabilistic models [8.615625517708324]
科学における基本的な課題は、研究中のシステムに関する貴重な洞察を得る実験を設計することである。
PDBALは,科学的有用性を最大化するために実験を適応的に設計する能動学習手法である。
論文 参考訳(メタデータ) (2022-10-21T17:22:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。