論文の概要: GFlowNets for AI-Driven Scientific Discovery
- arxiv url: http://arxiv.org/abs/2302.00615v2
- Date: Tue, 27 Jun 2023 12:10:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-28 17:39:33.514473
- Title: GFlowNets for AI-Driven Scientific Discovery
- Title(参考訳): AI駆動科学発見のためのGFlowNets
- Authors: Moksh Jain, Tristan Deleu, Jason Hartford, Cheng-Hao Liu, Alex
Hernandez-Garcia, Yoshua Bengio
- Abstract要約: 我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
- 参考スコア(独自算出の注目度): 74.27219800878304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tackling the most pressing problems for humanity, such as the climate crisis
and the threat of global pandemics, requires accelerating the pace of
scientific discovery. While science has traditionally relied on trial and error
and even serendipity to a large extent, the last few decades have seen a surge
of data-driven scientific discoveries. However, in order to truly leverage
large-scale data sets and high-throughput experimental setups, machine learning
methods will need to be further improved and better integrated in the
scientific discovery pipeline. A key challenge for current machine learning
methods in this context is the efficient exploration of very large search
spaces, which requires techniques for estimating reducible (epistemic)
uncertainty and generating sets of diverse and informative experiments to
perform. This motivated a new probabilistic machine learning framework called
GFlowNets, which can be applied in the modeling, hypotheses generation and
experimental design stages of the experimental science loop. GFlowNets learn to
sample from a distribution given indirectly by a reward function corresponding
to an unnormalized probability, which enables sampling diverse, high-reward
candidates. GFlowNets can also be used to form efficient and amortized Bayesian
posterior estimators for causal models conditioned on the already acquired
experimental data. Having such posterior models can then provide estimators of
epistemic uncertainty and information gain that can drive an experimental
design policy. Altogether, here we will argue that GFlowNets can become a
valuable tool for AI-driven scientific discovery, especially in scenarios of
very large candidate spaces where we have access to cheap but inaccurate
measurements or to expensive but accurate measurements. This is a common
setting in the context of drug and material discovery, which we use as examples
throughout the paper.
- Abstract(参考訳): 気候危機や世界的なパンデミックの脅威など、人類にとって最も差し迫った問題に取り組むためには、科学的発見のペースを早める必要がある。
科学は伝統的に試行錯誤やセレンディピティーに依存してきたが、過去数十年はデータ駆動の科学的発見が急増している。
しかし、大規模なデータセットと高スループットの実験的なセットアップを真に活用するためには、機械学習手法をさらに改良し、科学的発見パイプラインに統合する必要がある。
この文脈における現在の機械学習手法の重要な課題は、非常に大きな探索空間の効率的な探索である。
これはGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを動機付け、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用することができる。
gflownetsは、非正規化確率に対応する報奨関数によって間接的に与えられた分布からサンプルを学習する。
GFlowNetsは、既に取得した実験データに条件付けされた因果モデルに対して、効率的で償却されたベイズ後部推定器を形成するためにも使用できる。
このような後続モデルを持つことで、認識の不確実性と情報ゲインの推定者が実験的な設計方針を推し進めることができる。
ここでは、GFlowNetsがAIによる科学的発見のための貴重なツールになり得る、と論じる。特に、安価だが不正確な測定や、高価で正確な測定にアクセスできる非常に大きな候補空間のシナリオでは。
これは薬物や物質の発見の文脈において一般的な設定であり、論文全体の例として使用しています。
関連論文リスト
- Reliable edge machine learning hardware for scientific applications [34.87898436984149]
極端なデータレートの科学実験は、効率的なMLエッジ処理を必要とする大量のデータを生成する。
このような厳密なレイテンシ、リソース、パワー、および領域要件の下で、科学的なエッジで信頼できるアルゴリズムを開発し、検証するためのアプローチについて議論する。
論文 参考訳(メタデータ) (2024-06-27T20:45:08Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Multi-Fidelity Active Learning with GFlowNets [65.91555804996203]
本稿では,GFlowNetsをサンプルとして多要素能動学習アルゴリズムを提案する。
分子探索タスクの評価は,GFlowNetsを用いた多要素能動学習が,その単要素の予算のごく一部で高い評価の候補を発見できることを示す。
論文 参考訳(メタデータ) (2023-06-20T17:43:42Z) - Machine learning enabled experimental design and parameter estimation
for ultrafast spin dynamics [54.172707311728885]
機械学習とベイズ最適実験設計(BOED)を組み合わせた方法論を提案する。
本手法は,大規模スピンダイナミクスシミュレーションのためのニューラルネットワークモデルを用いて,BOEDの正確な分布と実用計算を行う。
数値ベンチマークでは,XPFS実験の誘導,モデルパラメータの予測,実験時間内でのより情報的な測定を行う上で,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-03T06:19:20Z) - Testing Causality in Scientific Modelling Software [0.26388783516590225]
Causal Testing Frameworkは、Causal Inferenceテクニックを使用して、既存のデータから因果効果を確立するフレームワークである。
実世界の科学モデルをカバーする3つのケーススタディとして、Causal Testing Frameworkがいかにメタモルフィックテストの結果を推測できるかを示す。
論文 参考訳(メタデータ) (2022-09-01T10:57:54Z) - Active Exploration via Experiment Design in Markov Chains [86.41407938210193]
科学と工学における重要な課題は、未知の量の興味について学ぶために実験を設計することである。
本稿では,最適値に収束したポリシを効率的に選択するアルゴリズムを提案する。
理論分析に加えて,生態モニタリングと薬理学の応用に関する枠組みを概説する。
論文 参考訳(メタデータ) (2022-06-29T00:04:40Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Complete CVDL Methodology for Investigating Hydrodynamic Instabilities [0.49873153106566565]
流体力学において、最も重要な研究分野の1つは流体力学の不安定性と異なる流れ状態におけるその進化である。
現在、そのような現象、すなわち分析モデル、実験、シミュレーションを理解するために3つの主要な手法が使用されている。
我々は、この研究の大部分が、Deep Learning(CVDL、Deep Computer-Vision)の分野における最近の画期的な進歩を用いて、分析されるべきであると主張している。
具体的には、最も代表的な不安定性であるRayleigh-Taylorの研究に焦点をあて、その振る舞いをシミュレートし、オープンソースの状態を作り出す。
論文 参考訳(メタデータ) (2020-04-03T13:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。