論文の概要: Solving Probability and Statistics Problems by Program Synthesis
- arxiv url: http://arxiv.org/abs/2111.08267v1
- Date: Tue, 16 Nov 2021 07:34:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 01:41:13.612848
- Title: Solving Probability and Statistics Problems by Program Synthesis
- Title(参考訳): プログラム合成による確率と統計問題の解法
- Authors: Leonard Tang and Elizabeth Ke and Nikhil Singh and Nakul Verma and
Iddo Drori
- Abstract要約: 大学レベルの確率と統計の問題をOpenAIのCodexを用いてプログラム合成することで解決する。
私たちの研究は、大学レベルの確率と統計に関する新しいデータセットを初めて導入しました。
- 参考スコア(独自算出の注目度): 1.0937094979510211
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We solve university level probability and statistics questions by program
synthesis using OpenAI's Codex, a Transformer trained on text and fine-tuned on
code. We transform course problems from MIT's 18.05 Introduction to Probability
and Statistics and Harvard's STAT110 Probability into programming tasks. We
then execute the generated code to get a solution. Since these course questions
are grounded in probability, we often aim to have Codex generate probabilistic
programs that simulate a large number of probabilistic dependencies to compute
its solution. Our approach requires prompt engineering to transform the
question from its original form to an explicit, tractable form that results in
a correct program and solution. To estimate the amount of work needed to
translate an original question into its tractable form, we measure the
similarity between original and transformed questions. Our work is the first to
introduce a new dataset of university-level probability and statistics problems
and solve these problems in a scalable fashion using the program synthesis
capabilities of large language models.
- Abstract(参考訳): 我々は,openai の codex を用いてプログラム合成を行い,大学レベルの確率と統計問題を解く。
我々は、MITの18.05の確率統計入門とハーバード大学のSTAT110の確率をプログラミングタスクに変換する。
そして、生成したコードを実行して解決策を得る。
これらのコースの疑問は確率で解決されるので、我々はしばしば、Codexがその解を計算するために多くの確率的依存関係をシミュレートする確率的プログラムを生成することを目指している。
当社のアプローチでは,質問を元の形式から,正しいプログラムと解を導出可能な明示的な形式に変換するために,迅速なエンジニアリングが必要である。
元の質問を抽出可能な形式に翻訳するために必要な作業量を推定するために,元の質問と変換された質問の類似度を測定する。
本研究は,大学レベルの確率・統計問題のデータセットを新たに導入し,大規模言語モデルのプログラム合成機能を用いて,スケーラブルな方法で解き明かした。
関連論文リスト
- Symbolic Parameter Learning in Probabilistic Answer Set Programming [0.16385815610837165]
本稿では,確率的集合プログラミングの形式化を解くための2つのアルゴリズムを提案する。
第一に、オフザシェルフ制約最適化ソルバを用いてタスクを解く。
2つ目は期待最大化アルゴリズムの実装に基づいている。
論文 参考訳(メタデータ) (2024-08-16T13:32:47Z) - Bayesian Quantum State Tomography with Python's PyMC [0.0]
我々は,Python-3 のオープンソース PyMC 確率型プログラミングパッケージを用いて,複雑でない QST 最適化問題を単純な形式に変換する方法を示す。
我々は,Python-3 のオープンソース PyMC 確率型プログラミングパッケージを用いて,複雑でない QST 最適化問題を単純な形式に変換する方法を示す。
論文 参考訳(メタデータ) (2022-12-20T21:16:28Z) - JiuZhang: A Chinese Pre-trained Language Model for Mathematical Problem
Understanding [74.12405417718054]
本稿では,中国初の数学的事前学習言語モデル(PLM)を提示することにより,機械の数学的知性向上を目指す。
他の標準のNLPタスクとは異なり、数学的テキストは問題文に数学的用語、記号、公式を含むため理解が難しい。
基礎課程と上級課程の両方からなる数学PLMの学習を改善するための新しいカリキュラム事前学習手法を設計する。
論文 参考訳(メタデータ) (2022-06-13T17:03:52Z) - An Application of a Multivariate Estimation of Distribution Algorithm to
Cancer Chemotherapy [59.40521061783166]
癌に対する化学療法治療は、多数の相互作用する変数と制約を持つ複雑な最適化問題である。
より洗練されたアルゴリズムは、このような複雑な問題に対してより良いパフォーマンスをもたらすことが示される。
我々は、この問題における多数の相互作用によって、より洗練されたアルゴリズムが妨げられていることが原因であると仮定する。
論文 参考訳(メタデータ) (2022-05-17T15:28:46Z) - A Conversational Paradigm for Program Synthesis [110.94409515865867]
本稿では,大規模言語モデルを用いた対話型プログラム合成手法を提案する。
私たちは、自然言語とプログラミング言語のデータに基づいて、CodeGenと呼ばれる大規模な言語モデルのファミリーを訓練します。
本研究は,会話能力の出現と,提案した会話プログラム合成パラダイムの有効性を示すものである。
論文 参考訳(メタデータ) (2022-03-25T06:55:15Z) - A Neural Network Solves and Generates Mathematics Problems by Program
Synthesis: Calculus, Differential Equations, Linear Algebra, and More [8.437319139670116]
質問をプログラミングタスクに変換し、プログラムを自動的に生成し、実行します。
これは、大学レベルの数学コースの質問を自動的に解き、評価し、生成する最初の作品である。
論文 参考訳(メタデータ) (2021-12-31T18:57:31Z) - ProbNum: Probabilistic Numerics in Python [62.52335490524408]
確率的数値法(PNMs)は確率的推論によって数値問題を解く。
ProbNum: 最先端のPNMを提供するPythonライブラリ。
論文 参考訳(メタデータ) (2021-12-03T07:20:50Z) - Solving Linear Algebra by Program Synthesis [1.0660480034605238]
我々は、MITのLinear Algebra 18.06コースとコロンビア大学のComputational Linear Algebra COMS3251コースを、インタラクティブなプログラム合成によって完全な精度で解決する。
この驚くほど強い結果は、コース質問をプログラミングタスクに変換し、プログラムを実行して正しい回答を生成することで達成されます。
論文 参考訳(メタデータ) (2021-11-16T01:16:43Z) - Measuring Mathematical Problem Solving With the MATH Dataset [55.4376028963537]
12,500の競合数学問題のデータセットであるMATHを紹介する。
各問題には、答えの導出と説明を生成するためのモデルを教えるために使用できる完全なステップバイステップソリューションがあります。
また、モデルに数学の基礎を教えるための補助的事前学習データセットも提供します。
論文 参考訳(メタデータ) (2021-03-05T18:59:39Z) - Marginal likelihood computation for model selection and hypothesis
testing: an extensive review [66.37504201165159]
この記事では、このトピックの最先端に関する総合的な研究について紹介する。
さまざまなテクニックの制限、メリット、コネクション、差異を強調します。
また、不適切な事前利用の問題や解決法についても述べる。
論文 参考訳(メタデータ) (2020-05-17T18:31:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。