論文の概要: Test Case Features as Hyper-heuristics for Inductive Programming
- arxiv url: http://arxiv.org/abs/2407.00519v1
- Date: Sat, 29 Jun 2024 19:46:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 02:46:30.881688
- Title: Test Case Features as Hyper-heuristics for Inductive Programming
- Title(参考訳): インダクティブプログラミングのための超ヒューリスティックとしてのテストケース機能
- Authors: Edward McDaid, Sarah McDaid,
- Abstract要約: テストケース型シグネチャをハイパーヒューリスティックとして使用して、多数のより小さな命令サブセットの1つを選択する。
多くのファミリーを持つことで、サブセットをリオーダーして、人間のコードにおける相対的な発生をよりよく反映することが可能になる。
全体として、新しいアプローチは、帰納的プログラミング検索空間を1桁から3桁まで小さくすることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Instruction subsets are heuristics that can reduce the size of the inductive programming search space by tens of orders of magnitude. Comprising many overlapping subsets of different sizes, they serve as predictions of the instructions required to code a solution for any problem. Currently, this approach employs a single, large family of subsets meaning that some problems can search thousands of subsets before a solution is found. In this paper we introduce the use of test case type signatures as hyper-heuristics to select one of many, smaller families of instruction subsets. The type signature for any set of test cases maps directly to a single family and smaller families mean that fewer subsets need to be considered for most problems. Having many families also permits subsets to be reordered to better reflect their relative occurrence in human code - again reducing the search space size for many problems. Overall the new approach can further reduce the size of the inductive programming search space by between 1 and 3 orders of magnitude, depending on the type signature. Larger and more consistent reductions are possible through the use of more sophisticated type systems. The potential use of additional test case features as hyper-heuristics and some other possible future work is also briefly discussed.
- Abstract(参考訳): 命令サブセット(英: Instruction subsets)とは、帰納的プログラミング検索空間のサイズを数十桁削減できるヒューリスティックな部分集合である。
異なるサイズの多くの重複部分集合をコンパイルすると、どんな問題に対しても解をコードするために必要な命令の予測として機能する。
現在、このアプローチでは、解が見つかる前に数千のサブセットを探索できる問題があることを意味する、単一の大きなサブセットの族が採用されている。
本稿では,テストケース型シグネチャをハイパーヒューリスティックとして使用して,多数のより小さな命令サブセットの1つを選択する。
テストケースの任意のセットの型シグネチャは、単一のファミリーと小さなファミリーに直接マップされる。
多くのファミリーを持つことで、サブセットをリオーダーして、人間のコードにおける相対的な発生をよりよく反映することが可能になる。
全体として、新しいアプローチは、型シグネチャに応じて、インダクティブプログラミング検索空間の1~3桁のサイズをさらに小さくすることができる。
より高度な型システムを使用することで、より大きく、より一貫した削減が可能になる。
超ヒューリスティックス(英語版)として追加のテストケース機能や、その他の今後の研究の可能性についても概説する。
関連論文リスト
- Active Learning with Simple Questions [20.239213248652376]
ドメインXに属するn個のラベルのない例のプールSを学習者が提示する活発な学習環境を考える。
我々は、学習者がドメインTサブセットXとターゲットラベルyのサブセットを選択することができるような、より一般的な領域クエリについて研究する。
我々は、VC次元 d の任意の仮説クラス H が与えられたとき、VC次元 O(d) の領域クエリファミリー Q を設計でき、これは n 個の例の集合 S の部分集合 X と H のすべての h* に対して、学習者が Q から A への O(d log n) クエリを提出できることを示している。
論文 参考訳(メタデータ) (2024-05-13T17:13:32Z) - Concomitant Group Testing [49.50984893039441]
肯定的なテストが複数種類の項目の組み合わせを必要とするという考え方を捉えたグループテストの問題のバリエーションを紹介した。
目標は、可能な限り少数のテストを使用して、半欠陥セットをすべて確実に識別することである。
我々のアルゴリズムは、(i)決定性(ゼロエラー)かランダム化(小エラー)か、(ii)非適応性(非適応性)、完全適応性(完全適応性)、あるいは限定適応性(限定適応性)かによって区別される。
論文 参考訳(メタデータ) (2023-09-08T09:11:12Z) - How Predictable Are Large Language Model Capabilities? A Case Study on
BIG-bench [52.11481619456093]
実験記録におけるBIGベンチの性能予測問題について検討する。
95%以上のR2$スコアは、実験記録の中に学習可能なパターンが存在することを示している。
BIG-bench Hardのように新しいモデルファミリーを評価できるサブセットが3倍程度小さくなっています。
論文 参考訳(メタデータ) (2023-05-24T09:35:34Z) - Further Decimating the Inductive Programming Search Space with
Instruction Digrams [0.0]
命令ダイアグラムを用いて,探索中の命令選択を制限できることが示される。
これにより、検索ベースの帰納的プログラミング技術を用いて生成できるプログラムのサイズが大幅に増大する。
論文 参考訳(メタデータ) (2023-05-22T15:58:18Z) - Interpretability at Scale: Identifying Causal Mechanisms in Alpaca [62.65877150123775]
本研究では、Boundless DASを用いて、命令に従う間、大規模言語モデルにおける解釈可能な因果構造を効率的に探索する。
私たちの発見は、成長し、最も広くデプロイされている言語モデルの内部構造を忠実に理解するための第一歩です。
論文 参考訳(メタデータ) (2023-05-15T17:15:40Z) - Shrinking the Inductive Programming Search Space with Instruction
Subsets [0.0]
本稿では,Zoea分散インダクティブプログラミングシステムにおける探索空間分割を支援するために構築された,新しいプログラミング言語命令共起モデルを提案する。
探索空間の異なる部分のアプローチを用いることで、並列に探索することができる。
必要となるサブセットの数は、それらを生成するために使用されるコードの量と線形に増加せず、管理可能なサブセットの数が、目に見えないコードの高い割合をカバーするのに十分である。
論文 参考訳(メタデータ) (2023-02-10T12:51:35Z) - On Computing Probabilistic Abductive Explanations [30.325691263226968]
最も広く研究されているAI(XAI)アプローチは正しくない。
PI説明は重要な欠点も示しており、最も目に見えるものはおそらくその大きさである。
本稿では,多くの広く使用されている分類器に対して,関連する集合を計算するための実践的アプローチについて検討する。
論文 参考訳(メタデータ) (2022-12-12T15:47:10Z) - Multi-Vector Retrieval as Sparse Alignment [21.892007741798853]
本稿では,クエリと文書トークンの相互アライメントを疎結合に学習する,新しいマルチベクタ検索モデルを提案する。
エントロピー規則化線形計画法により、疎度を達成するために他の手法よりも優れるスパースなユニタリサリエンスを学習する。
我々のモデルは、しばしば解釈可能なアライメントを生成し、より大きな言語モデルからその性能を著しく向上させる。
論文 参考訳(メタデータ) (2022-11-02T16:49:58Z) - Determinantal Beam Search [75.84501052642361]
ビームサーチは、ニューラルシーケンスモデルをデコードするためのゴーツー戦略である。
複数のソリューションを要求するユースケースでは、多様あるいは代表的なセットがしばしば望まれる。
ビームサーチを一連の部分決定問題として繰り返し行うことにより、アルゴリズムを多種多様なサブセット選択プロセスに変換することができる。
論文 参考訳(メタデータ) (2021-06-14T13:01:46Z) - Intrinsic Probing through Dimension Selection [69.52439198455438]
現代のほとんどのNLPシステムは、様々なタスクにおいて驚くほど高いパフォーマンスが得られる事前訓練された文脈表現を使用している。
このような高いパフォーマンスは、ある種の言語構造がこれらの表現に根ざしない限りはあり得ず、それを探究する研究が盛んに行われている。
本稿では,言語情報が表現内でどのように構造化されているかを示す内在的探索と,先行研究で広く普及している外在的探索とを区別し,抽出に成功したことを示すことによって,そのような情報の存在を主張するのみである。
論文 参考訳(メタデータ) (2020-10-06T15:21:08Z) - GOLD-NAS: Gradual, One-Level, Differentiable [100.12492801459105]
GOLD-NAS (Gradual One-Level Differentiable Neural Architecture Search) という新しいアルゴリズムを提案する。
1レベル最適化に可変リソース制約を導入し、弱い演算子をスーパーネットワークから徐々に追い出す。
論文 参考訳(メタデータ) (2020-07-07T10:37:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。