論文の概要: Optimal Learning for Sequential Decisions in Laboratory Experimentation
- arxiv url: http://arxiv.org/abs/2004.05417v2
- Date: Tue, 14 Apr 2020 00:54:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 10:08:38.416923
- Title: Optimal Learning for Sequential Decisions in Laboratory Experimentation
- Title(参考訳): 実験における逐次決定のための最適学習
- Authors: Kristopher Reyes and Warren B Powell
- Abstract要約: このチュートリアルは、実験科学者に意思決定の科学の基礎を提供することを目的としている。
学習政策の概念を導入し,主要な政策カテゴリを概観する。
次に、知識勾配と呼ばれるポリシーを導入し、各実験からの情報の価値を最大化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The process of discovery in the physical, biological and medical sciences can
be painstakingly slow. Most experiments fail, and the time from initiation of
research until a new advance reaches commercial production can span 20 years.
This tutorial is aimed to provide experimental scientists with a foundation in
the science of making decisions. Using numerical examples drawn from the
experiences of the authors, the article describes the fundamental elements of
any experimental learning problem. It emphasizes the important role of belief
models, which include not only the best estimate of relationships provided by
prior research, previous experiments and scientific expertise, but also the
uncertainty in these relationships. We introduce the concept of a learning
policy, and review the major categories of policies. We then introduce a
policy, known as the knowledge gradient, that maximizes the value of
information from each experiment. We bring out the importance of reducing
uncertainty, and illustrate this process for different belief models.
- Abstract(参考訳): 物理学、生物学、医学における発見のプロセスは、非常に遅い。
ほとんどの実験は失敗し、新たな進歩が商業生産に到達するまでの時間は20年に及ぶ。
このチュートリアルは、実験科学者に意思決定の科学の基礎を提供することを目的としている。
著者の経験から得られた数値例を用いて,実験学習問題の基本的な要素について述べる。
これは、先行研究、過去の実験、科学的専門知識によって提供される関係の最良の推定だけでなく、それらの関係における不確実性を含む、信念モデルの重要な役割を強調している。
我々は,学習政策の概念を紹介し,政策の主要なカテゴリをレビューする。
次に,各実験から得られる情報の価値を最大化する知識勾配と呼ばれる方針を導入する。
不確実性を減らすことの重要性を明らかにし、異なる信念モデルに対してこのプロセスを説明する。
関連論文リスト
- Hypothesizing Missing Causal Variables with LLMs [55.28678224020973]
我々は、入力が欠落変数を持つ部分因果グラフであるような新しいタスクを定式化し、出力は部分グラフを完成させるための欠落変数に関する仮説である。
原因と効果の間の媒介変数を仮説化するLLMの強い能力を示す。
また,オープンソースモデルの一部がGPT-4モデルより優れているという驚くべき結果も得られた。
論文 参考訳(メタデータ) (2024-09-04T10:37:44Z) - LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。
本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。
法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文 参考訳(メタデータ) (2024-05-16T03:04:10Z) - Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [50.40483334131271]
本研究は,社会科学の学術的仮説発見のための最初のデータセットを提案する。
従来のデータセットとは異なり、新しいデータセットには、(1)オープンドメインデータ(RAW Webコーパス)を観察として使用すること、(2)人間性にさらに新しい仮説を提案することが必要である。
パフォーマンス向上のための3つのフィードバック機構を含む,タスクのためのマルチモジュールフレームワークが開発されている。
論文 参考訳(メタデータ) (2023-09-06T05:19:41Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Empirical Design in Reinforcement Learning [23.873958977534993]
現在、数十のタスクに対して数百万のパラメータを持つエージェントのベンチマークが一般的であり、それぞれが30日間の経験に相当するものを使用している。
これらの実験の規模は、特にアルゴリズムの比較において、適切な統計的証拠の必要性と矛盾することが多い。
この写本は、行動への呼びかけと、強化学習において優れた実験を行うための包括的なリソースの両方を表現している。
論文 参考訳(メタデータ) (2023-04-03T19:32:24Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - Learning One Abstract Bit at a Time Through Self-Invented Experiments
Encoded as Neural Networks [8.594140167290098]
興味ある実験の自動生成に関する実験的検討を行った。
まず, 補強環境における自己発明実験について検討した。
2つ目の設定では、リカレントニューラルネットワークの重みとして純粋な思考実験が実施される。
論文 参考訳(メタデータ) (2022-12-29T17:11:49Z) - Sources of Irreproducibility in Machine Learning: A Review [3.905855359082687]
実験設計の選択と結論に対する潜在的な影響を関連付ける理論的枠組みは存在しない。
本研究の目的は、応用データサイエンスの実践者や研究者が、どのような設計選択が誤った発見につながるかを理解するためのフレームワークを開発することである。
論文 参考訳(メタデータ) (2022-04-15T18:26:03Z) - Observing Interventions: A logic for thinking about experiments [62.997667081978825]
本稿では,実験から学ぶ論理への第一歩について述べる。
我々のアプローチにとって重要なことは、介入の概念が(現実的または仮説的な)実験の形式的表現として使用できるという考えである。
提案された全ての論理系に対して、健全で完全な公理化を提供する。
論文 参考訳(メタデータ) (2021-11-25T09:26:45Z) - Autonomous Materials Discovery Driven by Gaussian Process Regression
with Inhomogeneous Measurement Noise and Anisotropic Kernels [1.976226676686868]
実験分野の大半は、新しい科学的発見を探すために、大規模で高次元のパラメータ空間を探索するという課題に直面している。
近年の進歩により、探査プロセスの自動化が進み、材料発見の効率が向上した。
ガンマプロセス回帰(GPR)技術は多くの種類の実験を操る方法として登場した。
論文 参考訳(メタデータ) (2020-06-03T19:18:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。