Fugu-MT 論文翻訳(概要): GFlowNets for AI-Driven Scientific Discovery

論文の概要: GFlowNets for AI-Driven Scientific Discovery

arxiv url: http://arxiv.org/abs/2302.00615v2
Date: Tue, 27 Jun 2023 12:10:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-28 17:39:33.514473
Title: GFlowNets for AI-Driven Scientific Discovery
Title（参考訳）: AI駆動科学発見のためのGFlowNets
Authors: Moksh Jain, Tristan Deleu, Jason Hartford, Cheng-Hao Liu, Alex Hernandez-Garcia, Yoshua Bengio
Abstract要約: 我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。 GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
参考スコア（独自算出の注目度）: 74.27219800878304
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Tackling the most pressing problems for humanity, such as the climate crisis and the threat of global pandemics, requires accelerating the pace of scientific discovery. While science has traditionally relied on trial and error and even serendipity to a large extent, the last few decades have seen a surge of data-driven scientific discoveries. However, in order to truly leverage large-scale data sets and high-throughput experimental setups, machine learning methods will need to be further improved and better integrated in the scientific discovery pipeline. A key challenge for current machine learning methods in this context is the efficient exploration of very large search spaces, which requires techniques for estimating reducible (epistemic) uncertainty and generating sets of diverse and informative experiments to perform. This motivated a new probabilistic machine learning framework called GFlowNets, which can be applied in the modeling, hypotheses generation and experimental design stages of the experimental science loop. GFlowNets learn to sample from a distribution given indirectly by a reward function corresponding to an unnormalized probability, which enables sampling diverse, high-reward candidates. GFlowNets can also be used to form efficient and amortized Bayesian posterior estimators for causal models conditioned on the already acquired experimental data. Having such posterior models can then provide estimators of epistemic uncertainty and information gain that can drive an experimental design policy. Altogether, here we will argue that GFlowNets can become a valuable tool for AI-driven scientific discovery, especially in scenarios of very large candidate spaces where we have access to cheap but inaccurate measurements or to expensive but accurate measurements. This is a common setting in the context of drug and material discovery, which we use as examples throughout the paper.
Abstract（参考訳）: 気候危機や世界的なパンデミックの脅威など、人類にとって最も差し迫った問題に取り組むためには、科学的発見のペースを早める必要がある。科学は伝統的に試行錯誤やセレンディピティーに依存してきたが、過去数十年はデータ駆動の科学的発見が急増している。しかし、大規模なデータセットと高スループットの実験的なセットアップを真に活用するためには、機械学習手法をさらに改良し、科学的発見パイプラインに統合する必要がある。この文脈における現在の機械学習手法の重要な課題は、非常に大きな探索空間の効率的な探索である。これはGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを動機付け、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用することができる。 gflownetsは、非正規化確率に対応する報奨関数によって間接的に与えられた分布からサンプルを学習する。 GFlowNetsは、既に取得した実験データに条件付けされた因果モデルに対して、効率的で償却されたベイズ後部推定器を形成するためにも使用できる。このような後続モデルを持つことで、認識の不確実性と情報ゲインの推定者が実験的な設計方針を推し進めることができる。ここでは、GFlowNetsがAIによる科学的発見のための貴重なツールになり得る、と論じる。特に、安価だが不正確な測定や、高価で正確な測定にアクセスできる非常に大きな候補空間のシナリオでは。これは薬物や物質の発見の文脈において一般的な設定であり、論文全体の例として使用しています。

関連論文リスト

Trustworthy scientific inference for inverse problems with generative models [2.986676058695281]
生成人工知能(AI)は、トレーニング例からパターンを学習することで、複雑なデータ構造(テキスト、画像、ビデオ)を生成できる。科学の分野では、研究者は観測データから隠れたパラメータを推測するために生成モデルを適用している。本稿では,Frequentist-Bayes(FreB)という,AI生成した確率分布を信頼領域に再認識する数学的厳密なプロトコルを提案する。
論文参考訳（メタデータ） (2025-08-04T16:56:11Z)
Unsupervised Machine Learning for Scientific Discovery: Workflow and Best Practices [4.6498278084317715]
教師なし機械学習は、気候科学、生物医学、天文学、化学などの重要な領域におけるデータ駆動的な発見に広く用いられている。広く利用されているにもかかわらず、信頼できる再現可能な科学的発見を行うための教師なし学習の標準化が欠如している。我々は、有効な科学的質問の定式化、堅牢なデータ準備と探索の実行、様々なモデリング手法の使用、教師なしの学習結論の安定性と一般化性の評価による厳密な検証、再現可能な科学的発見を保証するための効果的なコミュニケーションと結果の文書化の促進から始まるベストプラクティスを強調し、議論する。
論文参考訳（メタデータ） (2025-06-05T01:58:45Z)
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration [9.640689981816852]
自動科学的発見のための情報理論フレームワークである textttPiFlow を紹介する。提案手法は,曲線下面積の73.55%増加を反映して,発見効率を著しく向上させる。全体として、textttPiFlowはPlug-and-Playメソッドとして機能し、高度に効率的な自動科学的発見における新しいパラダイムシフトを確立する。
論文参考訳（メタデータ） (2025-05-21T03:09:39Z)
Building Machine Learning Challenges for Anomaly Detection in Science [94.24422981343699]
本稿では,異なる科学領域を対象とした機械学習による異常検出を目的とした3つのデータセットを提案する。 3つのデータセットを検索可能、アクセス可能、相互運用可能、再利用可能なものにするために、機械学習の課題を提起する。
論文参考訳（メタデータ） (2025-03-03T22:54:07Z)
Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。本稿では,実証的リスク最小化法(DEM)を提案する。
論文参考訳（メタデータ） (2025-02-10T10:52:17Z)
BoxingGym: Benchmarking Progress in Automated Experimental Design and Model Discovery [24.630117520005257]
実験的な設計とモデル発見を評価するための10環境のベンチマークであるBoxingGymを紹介する。予測情報ゲイン(EIG)は,実験が生成モデルのパラメータの不確実性をどの程度低減するかを測定する情報理論量である。 GPT-4oのような現在のLLMは、実験的な設計とモデル発見の両方に苦戦している。
論文参考訳（メタデータ） (2025-01-02T21:15:57Z)
Reliable edge machine learning hardware for scientific applications [34.87898436984149]
極端なデータレートの科学実験は、効率的なMLエッジ処理を必要とする大量のデータを生成する。このような厳密なレイテンシ、リソース、パワー、および領域要件の下で、科学的なエッジで信頼できるアルゴリズムを開発し、検証するためのアプローチについて議論する。
論文参考訳（メタデータ） (2024-06-27T20:45:08Z)
Seeing Unseen: Discover Novel Biomedical Concepts via Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文参考訳（メタデータ） (2024-03-02T00:56:05Z)
Multi-Fidelity Active Learning with GFlowNets [65.91555804996203]
本稿では,GFlowNetsをサンプルとして多要素能動学習アルゴリズムを提案する。分子探索タスクの評価は,GFlowNetsを用いた多要素能動学習が,その単要素の予算のごく一部で高い評価の候補を発見できることを示す。
論文参考訳（メタデータ） (2023-06-20T17:43:42Z)
Machine learning enabled experimental design and parameter estimation for ultrafast spin dynamics [54.172707311728885]
機械学習とベイズ最適実験設計(BOED)を組み合わせた方法論を提案する。本手法は,大規模スピンダイナミクスシミュレーションのためのニューラルネットワークモデルを用いて,BOEDの正確な分布と実用計算を行う。数値ベンチマークでは,XPFS実験の誘導,モデルパラメータの予測,実験時間内でのより情報的な測定を行う上で,本手法の優れた性能を示す。
論文参考訳（メタデータ） (2023-06-03T06:19:20Z)
Testing Causality in Scientific Modelling Software [0.26388783516590225]
Causal Testing Frameworkは、Causal Inferenceテクニックを使用して、既存のデータから因果効果を確立するフレームワークである。実世界の科学モデルをカバーする3つのケーススタディとして、Causal Testing Frameworkがいかにメタモルフィックテストの結果を推測できるかを示す。
論文参考訳（メタデータ） (2022-09-01T10:57:54Z)
Active Exploration via Experiment Design in Markov Chains [86.41407938210193]
科学と工学における重要な課題は、未知の量の興味について学ぶために実験を設計することである。本稿では,最適値に収束したポリシを効率的に選択するアルゴリズムを提案する。理論分析に加えて,生態モニタリングと薬理学の応用に関する枠組みを概説する。
論文参考訳（メタデータ） (2022-06-29T00:04:40Z)
Towards an Automatic Analysis of CHO-K1 Suspension Growth in Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文参考訳（メタデータ） (2020-10-20T08:36:51Z)
Complete CVDL Methodology for Investigating Hydrodynamic Instabilities [0.49873153106566565]
流体力学において、最も重要な研究分野の1つは流体力学の不安定性と異なる流れ状態におけるその進化である。現在、そのような現象、すなわち分析モデル、実験、シミュレーションを理解するために3つの主要な手法が使用されている。我々は、この研究の大部分が、Deep Learning(CVDL、Deep Computer-Vision)の分野における最近の画期的な進歩を用いて、分析されるべきであると主張している。具体的には、最も代表的な不安定性であるRayleigh-Taylorの研究に焦点をあて、その振る舞いをシミュレートし、オープンソースの状態を作り出す。
論文参考訳（メタデータ） (2020-04-03T13:52:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。