論文の概要: Kernel Density Estimation by Genetic Algorithm
- arxiv url: http://arxiv.org/abs/2203.01535v1
- Date: Thu, 3 Mar 2022 06:16:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 16:46:45.187927
- Title: Kernel Density Estimation by Genetic Algorithm
- Title(参考訳): 遺伝的アルゴリズムによるカーネル密度推定
- Authors: Kiheiji Nishida
- Abstract要約: 遺伝的アルゴリズムは、与えられた大きさの複数のサブサンプルを生成し、元のサンプルから置き換える。
フィットネスの点で 支配的なサブサンプルは 次世代に受け継がれる
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study proposes a data condensation method for multivariate kernel
density estimation by genetic algorithm. First, our proposed algorithm
generates multiple subsamples of a given size with replacement from the
original sample. The subsamples and their constituting data points are regarded
as $\it{chromosome}$ and $\it{gene}$, respectively, in the terminology of
genetic algorithm. Second, each pair of subsamples breeds two new subsamples,
where each data point faces either $\it{crossover}$, $\it{mutation}$, or
$\it{reproduction}$ with a certain probability. The dominant subsamples in
terms of fitness values are inherited by the next generation. This process is
repeated generation by generation and brings the sparse representation of
kernel density estimator in its completion. We confirmed from simulation
studies that the resulting estimator can perform better than other well-known
density estimators.
- Abstract(参考訳): 本研究では,遺伝的アルゴリズムによる多変量カーネル密度推定のためのデータ凝縮法を提案する。
まず,提案アルゴリズムは,元のサンプルから置換した任意のサイズのサブサンプルを生成する。
サブサンプルとそれらの構成データポイントはそれぞれ、遺伝的アルゴリズムの用語において、$\it{chromosome}$と$\it{gene}$と見なされる。
次に、各サブサンプルは2つの新しいサブサンプルを生成し、各データポイントは、ある確率で$\it{crossover}$, $\it{mutation}$, $\it{reproduction}$のいずれかに直面している。
適合値の点で支配的なサブサンプルは次世代に継承される。
このプロセスは世代によって繰り返し生成され、その完了時にカーネル密度推定器のスパース表現をもたらす。
シミュレーションにより, 推定器の性能が他の既知の密度推定器よりも優れていることを確認した。
関連論文リスト
- Efficient Multivariate Robust Mean Estimation Under Mean-Shift Contamination [35.67742880001828]
平均シフト汚染を用いた高次元ロバスト平均推定のための計算効率のよい最初のアルゴリズムを提案する。
提案アルゴリズムは, ほぼ最適サンプルの複雑性を持ち, サンプル・ポリノミカル時間で動作し, ターゲット平均を任意の精度で近似する。
論文 参考訳(メタデータ) (2025-02-20T17:53:13Z) - Data Structures for Density Estimation [66.36971978162461]
p$のサブリニア数($n$)が与えられた場合、主な結果は$k$のサブリニアで$v_i$を識別する最初のデータ構造になります。
また、Acharyaなどのアルゴリズムの改良版も提供します。
論文 参考訳(メタデータ) (2023-06-20T06:13:56Z) - Replicable Clustering [57.19013971737493]
我々は,統計学的な$k$-medians,統計学的な$k$-means,統計学的な$k$-centers問題のアルゴリズムをブラックボックス方式で近似ルーチンを用いて提案する。
理論的結果を検証するブラックボックスとしてsklearnの$k$-means++実装を用いた2次元合成分布の実験も行っている。
論文 参考訳(メタデータ) (2023-02-20T23:29:43Z) - DenseHybrid: Hybrid Anomaly Detection for Dense Open-set Recognition [1.278093617645299]
異常検出は、正規トレーニングデータの生成的モデリングや、負のトレーニングデータに対する識別によって行うことができる。
本稿では,大きな自然画像に対して密集した開集合認識が可能なハイブリッド異常スコアを提案する。
実験では, 標準密度異常検出ベンチマークと, オープンセット性能の新たな指標であるopen-mIoUについて評価した。
論文 参考訳(メタデータ) (2022-07-06T11:48:50Z) - Population based change-point detection for the identification of
homozygosity islands [0.0]
本稿では,動的プログラミングアルゴリズムで効率的に計算したり,高速なグリーディ二分法アルゴリズムで近似できるペナル化最大可能性法を提案する。
両アルゴリズムは、確率ベクトルの分布と独立サンプリングに関する非常に一般的な仮定の下で、ほぼ確実に変化点の集合に収束することを示す。
この新しいアプローチは、集団内の個人のゲノム上のホモ接合性島を同定する問題によって動機付けられている。
論文 参考訳(メタデータ) (2021-11-19T12:53:41Z) - A Method for Handling Multi-class Imbalanced Data by Geometry based
Information Sampling and Class Prioritized Synthetic Data Generation (GICaPS) [15.433936272310952]
本稿では,多ラベル分類問題における不均衡データ処理の問題について考察する。
特徴ベクトル間の幾何学的関係を利用する2つの新しい手法が提案されている。
提案手法の有効性は,汎用的なマルチクラス認識問題を解くことによって解析する。
論文 参考訳(メタデータ) (2020-10-11T04:04:26Z) - Private Stochastic Non-Convex Optimization: Adaptive Algorithms and
Tighter Generalization Bounds [72.63031036770425]
有界非次元最適化のための差分プライベート(DP)アルゴリズムを提案する。
標準勾配法に対する経験的優位性について,2つの一般的なディープラーニング手法を実証する。
論文 参考訳(メタデータ) (2020-06-24T06:01:24Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - Optimal Randomized First-Order Methods for Least-Squares Problems [56.05635751529922]
このアルゴリズムのクラスは、最小二乗問題に対する最も高速な解法のうち、いくつかのランダム化手法を含んでいる。
我々は2つの古典的埋め込み、すなわちガウス射影とアダマール変換のサブサンプリングに焦点を当てる。
得られたアルゴリズムは条件数に依存しない最小二乗問題の解法として最も複雑である。
論文 参考訳(メタデータ) (2020-02-21T17:45:32Z) - Optimal Iterative Sketching with the Subsampled Randomized Hadamard
Transform [64.90148466525754]
最小二乗問題に対する反復スケッチの性能について検討する。
本研究では、Haar行列とランダム化されたHadamard行列の収束速度が同一であることを示し、ランダムなプロジェクションを経時的に改善することを示した。
これらの手法は、ランダム化次元還元を用いた他のアルゴリズムにも適用することができる。
論文 参考訳(メタデータ) (2020-02-03T16:17:50Z) - Oracle Lower Bounds for Stochastic Gradient Sampling Algorithms [39.746670539407084]
我々は、$bbRd$の強い対数凹密度からサンプリングする問題を考察する。
必要なログ密度の勾配クエリ数に基づいて,情報理論の下界を証明した。
論文 参考訳(メタデータ) (2020-02-01T23:46:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。