論文の概要: Targeted active learning for probabilistic models
- arxiv url: http://arxiv.org/abs/2210.12122v1
- Date: Fri, 21 Oct 2022 17:22:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 13:59:08.720345
- Title: Targeted active learning for probabilistic models
- Title(参考訳): 確率モデルのための目標アクティブラーニング
- Authors: Christopher Tosh and Mauricio Tec and Wesley Tansey
- Abstract要約: 科学における基本的な課題は、研究中のシステムに関する貴重な洞察を得る実験を設計することである。
PDBALは,科学的有用性を最大化するために実験を適応的に設計する能動学習手法である。
- 参考スコア(独自算出の注目度): 8.615625517708324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A fundamental task in science is to design experiments that yield valuable
insights about the system under study. Mathematically, these insights can be
represented as a utility or risk function that shapes the value of conducting
each experiment. We present PDBAL, a targeted active learning method that
adaptively designs experiments to maximize scientific utility. PDBAL takes a
user-specified risk function and combines it with a probabilistic model of the
experimental outcomes to choose designs that rapidly converge on a high-utility
model. We prove theoretical bounds on the label complexity of PDBAL and provide
fast closed-form solutions for designing experiments with common exponential
family likelihoods. In simulation studies, PDBAL consistently outperforms
standard untargeted approaches that focus on maximizing expected information
gain over the design space. Finally, we demonstrate the scientific potential of
PDBAL through a study on a large cancer drug screen dataset where PDBAL quickly
recovers the most efficacious drugs with a small fraction of the total number
of experiments.
- Abstract(参考訳): 科学における基本的なタスクは、研究中のシステムに関する貴重な洞察を与える実験を設計することである。
数学的には、これらの洞察は、それぞれの実験を行う価値を形作るユーティリティまたはリスク関数として表すことができる。
PDBALは,科学的有用性を最大化するために実験を適応的に設計する能動学習手法である。
PDBALは、ユーザが指定したリスク関数を実験結果の確率モデルと組み合わせて、高ユーティリティモデルに迅速に収束する設計を選択する。
我々は、PDBALのラベル複雑性に関する理論的境界を証明し、共通の指数族確率を持つ実験を設計するための高速閉形式解を提供する。
シミュレーション研究において、PDBALは設計空間における期待される情報の獲得を最大化することに焦点を当てた標準的未目標アプローチを一貫して上回っている。
最後に、PDBALの科学的ポテンシャルを、PDBALが実験総数のごく一部で、最も有効な薬物を迅速に回収する大規模がん薬物スクリーニングデータセットの研究を通して実証する。
関連論文リスト
- Physical formula enhanced multi-task learning for pharmacokinetics prediction [54.13787789006417]
AIによる薬物発見の大きな課題は、高品質なデータの不足である。
薬物動態の4つの重要なパラメータを同時に予測するPEMAL法を開発した。
実験の結果,PEMALは一般的なグラフニューラルネットワークに比べてデータ需要を著しく低減することがわかった。
論文 参考訳(メタデータ) (2024-04-16T07:42:55Z) - DiscoBAX: Discovery of Optimal Intervention Sets in Genomic Experiment
Design [61.48963555382729]
本研究では,実験1回あたりの有意な発見率を最大化するためのサンプル効率向上手法としてDiscoBAXを提案する。
我々は、標準仮定の下で近似最適性の理論的保証を提供し、包括的な実験評価を行う。
論文 参考訳(メタデータ) (2023-12-07T06:05:39Z) - PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction
Prediction Model for Binding Affinity Scoring and Virtual Screening [0.0]
タンパク質-リガンド相互作用の予測(PLI)は、薬物発見において重要な役割を果たす。
結合親和性を正確に評価し、効率的な仮想スクリーニングを行う汎用モデルの開発は依然として課題である。
本稿では、物理インフォームドグラフニューラルネットワークと組み合わせて、新しいデータ拡張戦略を導入することにより、実現可能なソリューションを提案する。
論文 参考訳(メタデータ) (2023-07-03T14:46:49Z) - Machine learning enabled experimental design and parameter estimation
for ultrafast spin dynamics [54.172707311728885]
機械学習とベイズ最適実験設計(BOED)を組み合わせた方法論を提案する。
本手法は,大規模スピンダイナミクスシミュレーションのためのニューラルネットワークモデルを用いて,BOEDの正確な分布と実用計算を行う。
数値ベンチマークでは,XPFS実験の誘導,モデルパラメータの予測,実験時間内でのより情報的な測定を行う上で,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-03T06:19:20Z) - Designing Optimal Behavioral Experiments Using Machine Learning [8.759299724881219]
BOEDと機械学習の最近の進歩を活用して、あらゆる種類のモデルに対して最適な実験を見つけるためのチュートリアルを提供する。
マルチアームバンディット意思決定タスクにおける探索と搾取のバランスに関する理論を考察する。
文献でよく用いられる実験的な設計と比較すると、最適な設計は個人の行動に最適なモデルのどれが最適かをより効率的に決定する。
論文 参考訳(メタデータ) (2023-05-12T18:24:30Z) - Online simulator-based experimental design for cognitive model selection [74.76661199843284]
本稿では,抽出可能な確率を伴わない計算モデルを選択する実験設計手法BOSMOSを提案する。
シミュレーション実験では,提案手法により,既存のLFI手法に比べて最大2桁の精度でモデルを選択することができることを示した。
論文 参考訳(メタデータ) (2023-03-03T21:41:01Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Bayesian Optimal Experimental Design for Simulator Models of Cognition [14.059933880568908]
BOEDの最近の進歩と、難解モデルに対する近似推論を組み合わせ、最適な実験設計を求める。
マルチアームバンディットタスクのシミュレーション実験により,モデル判別とパラメータ推定の改善が得られた。
論文 参考訳(メタデータ) (2021-10-29T09:04:01Z) - GeneDisco: A Benchmark for Experimental Design in Drug Discovery [41.6425999218259]
遺伝子操作によるin vitro細胞実験は、早期の薬物発見における重要なステップである。
GeneDiscoは、薬物発見の実験的な設計のためのアクティブな学習アルゴリズムを評価するためのベンチマークスイートである。
論文 参考訳(メタデータ) (2021-10-22T16:01:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。