論文の概要: Turaco: Complexity-Guided Data Sampling for Training Neural Surrogates
of Programs
- arxiv url: http://arxiv.org/abs/2309.11726v1
- Date: Thu, 21 Sep 2023 01:59:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 16:59:32.836941
- Title: Turaco: Complexity-Guided Data Sampling for Training Neural Surrogates
of Programs
- Title(参考訳): turaco: プログラムのニューラルネットワークサロゲートトレーニングのための複雑性誘導データサンプリング
- Authors: Alex Renda, Yi Ding, Michael Carbin
- Abstract要約: 本稿では,ニューラルネットワークに基づくプログラムのサロゲートをトレーニングするための,データセットのサンプリング手法を提案する。
まず,プログラムの入力空間の各領域からのサンプルデータの割合を,対応する実行パスのサロゲートを学習する複雑性に基づいて特徴付ける。
これらの結果を実世界のプログラムで評価し,複雑性誘導サンプリングが精度を実証的に向上させることを示した。
- 参考スコア(独自算出の注目度): 14.940174578659603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Programmers and researchers are increasingly developing surrogates of
programs, models of a subset of the observable behavior of a given program, to
solve a variety of software development challenges. Programmers train
surrogates from measurements of the behavior of a program on a dataset of input
examples. A key challenge of surrogate construction is determining what
training data to use to train a surrogate of a given program.
We present a methodology for sampling datasets to train neural-network-based
surrogates of programs. We first characterize the proportion of data to sample
from each region of a program's input space (corresponding to different
execution paths of the program) based on the complexity of learning a surrogate
of the corresponding execution path. We next provide a program analysis to
determine the complexity of different paths in a program. We evaluate these
results on a range of real-world programs, demonstrating that complexity-guided
sampling results in empirical improvements in accuracy.
- Abstract(参考訳): プログラマや研究者は、様々なソフトウェア開発の課題を解決するために、プログラムの監視可能な振る舞いのサブセットのモデルであるプログラムのサロゲートを開発しています。
プログラムは入力サンプルのデータセット上でプログラムの振る舞いの測定から代理語を訓練する。
サロゲート構築の重要な課題は、特定のプログラムのサロゲートをトレーニングするために使用するトレーニングデータを決定することである。
本稿では,ニューラルネットワークに基づくプログラムのサロゲートを学習するためのデータセットのサンプリング手法を提案する。
まず,プログラムの入力空間の各領域(プログラムの実行経路が異なる)のサンプルデータの割合を,対応する実行経路のサロゲートを学習する複雑性に基づいて特徴付ける。
次に,プログラム内の異なる経路の複雑性を決定するプログラム解析を行う。
これらの結果を実世界のプログラムで評価し,複雑性誘導サンプリングが精度を実証的に向上させることを示した。
関連論文リスト
- Hierarchical Programmatic Reinforcement Learning via Learning to Compose
Programs [58.94569213396991]
プログラムポリシーを作成するための階層型プログラム強化学習フレームワークを提案する。
提案するフレームワークは,プログラム作成の学習を通じて,アウト・オブ・ディストリビュータの複雑な動作を記述するプログラムポリシーを作成することができる。
Karel ドメインの実験結果から,提案するフレームワークがベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2023-01-30T14:50:46Z) - Learning from Self-Sampled Correct and Partially-Correct Programs [96.66452896657991]
そこで本研究では,モデルが学習中にサンプリングを行い,自己サンプリングされた完全正当プログラムと部分正当プログラムの両方から学習することを提案する。
自己サンプリング型プログラムと部分修正型プログラムを併用することで,学習とサンプリングプロセスのガイドに役立てることができることを示す。
提案手法は,MLEを用いた単一の参照プログラムからの学習と比較して,パス@kの性能を3.1%から12.3%向上させる。
論文 参考訳(メタデータ) (2022-05-28T03:31:07Z) - Latent Execution for Neural Program Synthesis Beyond Domain-Specific
Languages [97.58968222942173]
入力出力の例からCプログラムを合成する第一歩を踏み出す。
特に,部分生成プログラムの実行を近似するために潜在表現を学習するLa Synthを提案する。
これらのプログラムのトレーニングにより,Karel と C のプログラム合成における予測性能がさらに向上することを示す。
論文 参考訳(メタデータ) (2021-06-29T02:21:32Z) - Learning to Combine Per-Example Solutions for Neural Program Synthesis [35.0204840620086]
ほとんどの学習ベースのアプローチは、一度にすべての例を満たすプログラムを見つけようとします。
a) 1つの例のみを満たすプログラムを見つけ、(b) 例ごとのソリューションを活用して、すべての例を満たすプログラムを生成する。
論文 参考訳(メタデータ) (2021-06-14T05:48:12Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - Neural Program Synthesis with a Differentiable Fixer [44.48509453344902]
本稿では,エンコーダとデコーダをベースとした合成アーキテクチャと,プログラムを識別可能な固定器を組み合わせた新しいプログラム合成手法を提案する。
RobustFillドメイン上でアーキテクチャをエンドツーエンドにトレーニングし、フィクスチャモジュールの追加によって、合成精度が大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-06-19T01:49:46Z) - Creating Synthetic Datasets via Evolution for Neural Program Synthesis [77.34726150561087]
いくつかのプログラム合成手法は、ランダムに生成された例と異なるデータ分布によく一般化されていることを示す。
本稿では, 合成データ分布のバイアスを制御し, 現在の手法より優れていることを示すための, 新たな敵対的手法を提案する。
論文 参考訳(メタデータ) (2020-03-23T18:34:15Z) - Synthetic Datasets for Neural Program Synthesis [66.20924952964117]
本稿では,プログラムと仕様の両方で合成データ分布のバイアスを制御し,評価するための新しい手法を提案する。
そこで我々は,Karel DSLと小さなCalculator DSLを用いて,これらの分布上でのディープネットワークのトレーニングにより,分散一般化性能が向上することが実証された。
論文 参考訳(メタデータ) (2019-12-27T21:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。