論文の概要: A Static Analysis of Informed Down-Samples
- arxiv url: http://arxiv.org/abs/2304.01978v2
- Date: Mon, 17 Apr 2023 00:00:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 20:17:10.420203
- Title: A Static Analysis of Informed Down-Samples
- Title(参考訳): インフォームドダウンサンプルの静的解析
- Authors: Ryan Boldi, Alexander Lalejini, Thomas Helmuth, Lee Spector
- Abstract要約: 遺伝子プログラミングの第1世代における記録された個体群と、完全に合成された個体群について検討した。
両形態のダウンサンプリングは, ダウンサンプリングを伴わない通常のレキシケース選択よりも, テストカバレッジの損失が大きくなることを示した。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an analysis of the loss of population-level test coverage induced
by different down-sampling strategies when combined with lexicase selection. We
study recorded populations from the first generation of genetic programming
runs, as well as entirely synthetic populations. Our findings verify the
hypothesis that informed down-sampling better maintains population-level test
coverage when compared to random down-sampling. Additionally, we show that both
forms of down-sampling cause greater test coverage loss than standard lexicase
selection with no down-sampling. However, given more information about the
population, we found that informed down-sampling can further reduce its test
coverage loss. We also recommend wider adoption of the static population
analyses we present in this work.
- Abstract(参考訳): 本稿では,レキシケース選択と組み合わせたダウンサンプリング戦略によって生じる集団レベルのテストカバレッジの損失について分析する。
本研究は,第1世代の遺伝的プログラミング・ランの個体群と,全合成個体群について記録した。
本研究は,ダウンサンプリングがランダムダウンサンプリングと比較して集団レベルのテストカバレッジを良好に維持する仮説を検証した。
さらに,どちらのダウンサンプリングも,ダウンサンプリングを伴わない標準レキシケース選択よりもテストカバレッジの損失が大きいことを示した。
しかし、人口に関するさらなる情報を考えると、インフォームドダウンサンプリングはテストカバレッジの損失をさらに減らすことができることがわかった。
また,本研究における静的集団分析を広く採用することを推奨する。
関連論文リスト
- Optimal Downsampling for Imbalanced Classification with Generalized Linear Models [6.14486033794703]
一般化線形モデル(GLM)を用いた不均衡分類のための最適ダウンサンプリングについて検討する。
疑似疑似推定器を提案し,その正規性について,不均衡な人口の増加の文脈で検討する。
論文 参考訳(メタデータ) (2024-10-11T17:08:13Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Informed Down-Sampled Lexicase Selection: Identifying productive
training cases for efficient problem solving [40.683810697551166]
遺伝的プログラミング(GP)は、しばしば大きなトレーニングセットを使用し、選択中にすべてのトレーニングケースですべての個人を評価する必要がある。
ランダムダウンサンプリングレキシケースの選択は、トレーニングケースのランダムなサブセットのみの個人を評価し、同じプログラム実行量でより多くの個人を探索できるようにする。
Informed Down-Sampled Lexicase Selectionでは、人口統計を用いて、より明瞭で情報的な訓練ケースを含むダウンサンプルを構築します。
論文 参考訳(メタデータ) (2023-01-04T08:47:18Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - The Environmental Discontinuity Hypothesis for Down-Sampled Lexicase
Selection [0.0]
ダウンサンプリングは、レキシケース親選択技術を利用した遺伝的プログラミング(GP)に有効であることが証明された。
我々は、世代毎に行われるランダムサンプリングが不連続を引き起こし、人口が変動する環境に適応できないという仮説を立てた。
環境変化を増進させることは、単純なランダムなダウンサンプリングよりも、プログラム合成問題を解くための進化的ソリューションにとって、それほど良くないことがわかった。
論文 参考訳(メタデータ) (2022-05-31T16:21:14Z) - Saliency Grafting: Innocuous Attribution-Guided Mixup with Calibrated
Label Mixing [104.630875328668]
ミックスアップスキームは、強化されたトレーニングサンプルを作成するために、サンプルのペアを混ぜることを提案する。
両世界のベストを捉えた、斬新だがシンプルなミックスアップ版を提示する。
論文 参考訳(メタデータ) (2021-12-16T11:27:48Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Compressing Large Sample Data for Discriminant Analysis [78.12073412066698]
判別分析フレームワーク内での大きなサンプルサイズに起因する計算問題を考察する。
線形および二次判別分析のためのトレーニングサンプル数を削減するための新しい圧縮手法を提案する。
論文 参考訳(メタデータ) (2020-05-08T05:09:08Z) - UGRWO-Sampling for COVID-19 dataset: A modified random walk
under-sampling approach based on graphs to imbalanced data classification [2.15242029196761]
本稿では,不均衡なデータセットのグラフに基づく新しいRWO-Sampling(Random Walk Over-Sampling)を提案する。
アンダーサンプリング法とオーバーサンプリング法に基づく2つのスキームを導入し,ノイズや外れ値に対して近接情報を堅牢に保つ。
論文 参考訳(メタデータ) (2020-02-10T03:29:24Z) - Overly Optimistic Prediction Results on Imbalanced Data: a Case Study of
Flaws and Benefits when Applying Over-sampling [13.463035357173045]
データを相互に排他的なトレーニングとテストセットに分割する前にオーバーサンプリングを適用する。
この結果が,2つの人工データセットを用いて偏りを生じさせ,この欠陥が同定された研究結果を再現することを示す。
論文 参考訳(メタデータ) (2020-01-15T12:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。