論文の概要: PSB2: The Second Program Synthesis Benchmark Suite
- arxiv url: http://arxiv.org/abs/2106.06086v1
- Date: Thu, 10 Jun 2021 23:44:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-27 01:42:34.686499
- Title: PSB2: The Second Program Synthesis Benchmark Suite
- Title(参考訳): psb2:第2のプログラム合成ベンチマークスイート
- Authors: Thomas Helmuth and Peter Kelly
- Abstract要約: 新しいベンチマークスイートであるPSB2を構成する25の新しい汎用プログラム合成ベンチマーク問題について述べる。
これらの問題は、プログラミング方や大学コースなど、さまざまなソースから収集されている。
これらの新たな問題は、今後6年以上にわたる一般的なプログラム合成研究の道のりを指して、改善の余地を十分に与えている。
- 参考スコア(独自算出の注目度): 1.370633147306388
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: For the past six years, researchers in genetic programming and other program
synthesis disciplines have used the General Program Synthesis Benchmark Suite
to benchmark many aspects of automatic program synthesis systems. These
problems have been used to make notable progress toward the goal of general
program synthesis: automatically creating the types of software that human
programmers code. Many of the systems that have attempted the problems in the
original benchmark suite have used it to demonstrate performance improvements
granted through new techniques. Over time, the suite has gradually become
outdated, hindering the accurate measurement of further improvements. The field
needs a new set of more difficult benchmark problems to move beyond what was
previously possible.
In this paper, we describe the 25 new general program synthesis benchmark
problems that make up PSB2, a new benchmark suite. These problems are curated
from a variety of sources, including programming katas and college courses. We
selected these problems to be more difficult than those in the original suite,
and give results using PushGP showing this increase in difficulty. These new
problems give plenty of room for improvement, pointing the way for the next six
or more years of general program synthesis research.
- Abstract(参考訳): 過去6年間、遺伝的プログラミングやその他のプログラム合成分野の研究者は、general program synthesis benchmark suiteを使用して、自動プログラム合成システムの多くの側面をベンチマークしてきた。
これらの問題は、人間のプログラマがコーディングするソフトウェアのタイプを自動的に作成するという、一般的なプログラム合成の目標に向けて顕著な進歩をもたらすために使われてきた。
オリジナルのベンチマークスイートで問題を試みたシステムの多くは、新しいテクニックによって与えられたパフォーマンス改善を示すためにそれを使用している。
時間が経つにつれて、スイートは時代遅れになり、さらなる改善の正確な測定を妨げている。
この分野では、以前可能だったものを超えるために、より難しいベンチマークの新たなセットが必要です。
本稿では,新しいベンチマークスイートPSB2を構成する25の新しい汎用プログラム合成ベンチマーク問題について述べる。
これらの問題は、プログラミングの型や大学のコースなど、さまざまなソースから学べる。
我々はこれらの問題を元のスイートよりも難易度の高いものを選び、PushGPを用いた結果からこの難易度の増加を示した。
これらの新しい問題は、今後6年以上にわたる一般的なプログラム合成研究の道を示す多くの改善の余地を与えている。
関連論文リスト
- ExeDec: Execution Decomposition for Compositional Generalization in Neural Program Synthesis [54.18659323181771]
プログラム合成において望ましいいくつかの異なる構成一般化形式を特徴付ける。
本稿では,ExeDecを提案する。ExeDecは,実行サブゴールを予測し,各ステップでプログラム実行によって段階的に通知される問題を解くための,新しい分解ベースの戦略である。
論文 参考訳(メタデータ) (2023-07-26T01:07:52Z) - Learning-Based Automatic Synthesis of Software Code and Configuration [0.951828574518325]
大規模な自動ソフトウェア生成と構成は非常に複雑で難しい作業です。
まず,入力出力仕様で自動的にソフトウェアを合成することを提案する。
2つ目の課題として,異なる入力ファイルから大規模ソフトウェアの構成を合成することを提案する。
論文 参考訳(メタデータ) (2023-05-25T01:41:30Z) - NAPG: Non-Autoregressive Program Generation for Hybrid Tabular-Textual
Question Answering [52.10214317661547]
現在の数値推論法はプログラムシーケンスを自己回帰的にデコードする。
プログラム生成の精度は、デコードステップがエラー伝搬によって展開されるにつれて急激に低下する。
本稿では,非自己回帰型プログラム生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-07T11:25:21Z) - Synthesizing Programs with Continuous Optimization [4.457604452495174]
本稿では,連続最適化問題としてプログラム合成の新たな定式化を提案する。
次に、連続的な定式化を実際のプログラムに変換するためのマッピングスキームを提案する。
論文 参考訳(メタデータ) (2022-11-02T02:12:10Z) - Compositional Generalization and Decomposition in Neural Program
Synthesis [59.356261137313275]
本稿では,学習プログラムシンセサイザーの合成一般化能力の測定に焦点をあてる。
まず、プログラム合成法が一般化されるであろういくつかの異なる軸を特徴付ける。
2つの一般的な既存のデータセットに基づいて、これらの能力を評価するためのタスクのベンチマークスイートを導入する。
論文 参考訳(メタデータ) (2022-04-07T22:16:05Z) - Iterative Genetic Improvement: Scaling Stochastic Program Synthesis [11.195558777385259]
プログラム合成は、与えられた仕様を満たす基礎となるプログラミング言語からプログラムを自動的に見つけることを目的としている。
既存のプログラム合成技術はこの期待を十分に満たさず、スケーラビリティの問題に悩まされている。
本稿では、この問題を解決するために反復的遺伝的改善と呼ばれるプログラム合成の新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-02-26T02:00:35Z) - Choose Your Programming Copilot: A Comparison of the Program Synthesis
Performance of GitHub Copilot and Genetic Programming [2.2559617939136505]
GitHub Copilotは、大規模な言語モデルであるCodexを利用したVisual Studio Code開発環境の拡張である。
本稿では,GitHub Copilotを標準プログラム合成ベンチマーク問題で評価し,得られた結果と遺伝プログラミング文献との比較を行う。
ベンチマーク問題に対する2つのアプローチのパフォーマンスはよく似ているが、GitHub Copilotと比較すると、遺伝的プログラミングに基づくプログラム合成アプローチはまだ十分に成熟していない。
論文 参考訳(メタデータ) (2021-11-15T16:30:12Z) - Searching for More Efficient Dynamic Programs [61.79535031840558]
本稿では,プログラム変換の集合,変換プログラムの効率を評価するための単純な指標,およびこの指標を改善するための探索手順について述べる。
実際に、自動検索は初期プログラムの大幅な改善を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-09-14T20:52:55Z) - Recent Developments in Program Synthesis with Evolutionary Algorithms [1.8047694351309207]
関連する進化的プログラム合成手法を同定し,その性能を詳細に解析する。
私たちが特定する最も影響力のあるアプローチは、スタックベース、文法誘導、および線形遺伝プログラミングである。
今後の研究のために、研究者は、プログラムのアウトプットを使用して、ソリューションの品質を評価するだけでなく、ソリューションへの道を開くことを奨励します。
論文 参考訳(メタデータ) (2021-08-27T11:38:27Z) - BUSTLE: Bottom-Up Program Synthesis Through Learning-Guided Exploration [72.88493072196094]
プログラムのボトムアップ検索に学習を活用する新しい合成手法を提案する。
特に、入力出力例のセットに基づいて、探索条件中の中間値の合成を優先順位付けするようにモデルを訓練する。
単純な教師付き学習アプローチであっても,学習とボトムアップ検索の組み合わせは極めて効果的であることを示す。
論文 参考訳(メタデータ) (2020-07-28T17:46:18Z) - Synthesize, Execute and Debug: Learning to Repair for Neural Program
Synthesis [81.54148730967394]
本稿では,合成,実行,デバッグの段階を組み込んだニューラルネットワーク生成フレームワークであるSEDを提案する。
SEDはまず、神経プログラムシンセサイザーコンポーネントを使用して初期プログラムを生成し、その後、神経プログラムデバッガを使用して生成されたプログラムを反復的に修復する。
挑戦的な入出力プログラム合成ベンチマークであるKarelでは、SEDはニューラルプログラムシンセサイザー自体のエラー率をかなりのマージンで削減し、デコードのための標準ビームサーチより優れている。
論文 参考訳(メタデータ) (2020-07-16T04:15:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。