論文の概要: Feature subset selection for Big Data via Chaotic Binary Differential
Evolution under Apache Spark
- arxiv url: http://arxiv.org/abs/2202.03795v1
- Date: Tue, 8 Feb 2022 11:39:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-26 09:03:30.758740
- Title: Feature subset selection for Big Data via Chaotic Binary Differential
Evolution under Apache Spark
- Title(参考訳): Apache Sparkによるカオスバイナリ微分進化によるビッグデータの特徴サブセット選択
- Authors: Yelleti Vivek, Vadlamani Ravi and P. Radhakrishna
- Abstract要約: 本稿では,基数とAUCを含む新しい乗法的単一目的関数を提案する。
二項微分進化(BDE)にロジスティックおよびテントカオス写像を組み込み、それをカオス二項微分進化(CBDE)と命名した。
その結果,P-CBDE-iS(Chaotic Binary Differential Evolution)とP-CBDE-iS(Chaotic Binary Differential Evolution)により,より高品質な特徴部分集合が得られた。
- 参考スコア(独自算出の注目度): 4.241208172557663
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feature subset selection (FSS) using a wrapper approach is essentially a
combinatorial optimization problem having two objective functions namely
cardinality of the selected-feature-subset, which should be minimized and the
corresponding area under the ROC curve (AUC) to be maximized. In this research
study, we propose a novel multiplicative single objective function involving
cardinality and AUC. The randomness involved in the Binary Differential
Evolution (BDE) may yield less diverse solutions thereby getting trapped in
local minima. Hence, we embed Logistic and Tent chaotic maps into the BDE and
named it as Chaotic Binary Differential Evolution (CBDE). Designing a scalable
solution to the FSS is critical when dealing with high-dimensional and
voluminous datasets. Hence, we propose a scalable island (iS) based
parallelization approach where the data is divided into multiple
partitions/islands thereby the solution evolves individually and gets combined
eventually in a migration strategy. The results empirically show that the
proposed parallel Chaotic Binary Differential Evolution (P-CBDE-iS) is able to
find the better quality feature subsets than the Parallel Bi-nary Differential
Evolution (P-BDE-iS). Logistic Regression (LR) is used as a classifier owing to
its simplicity and power. The speedup attained by the proposed parallel
approach signifies the importance.
- Abstract(参考訳): ラッパーアプローチを用いた特徴部分選択(FSS)は、基本的には、選択された特徴サブセットの濃度とROC曲線(AUC)の対応する領域を最大化する2つの目的関数を持つ組合せ最適化問題である。
本研究では,基数とAUCを含む新しい乗法的単一目的関数を提案する。
バイナリ微分進化(BDE)に関わるランダム性は、より多様な解をもたらすため、局所的なミニマに閉じ込められる可能性がある。
したがって、ロジスティック写像とテント写像をBDEに埋め込んで、それをCBDE(Chaotic Binary Differential Evolution)と名付けた。
FSSに対するスケーラブルなソリューションの設計は、高次元および高輝度なデータセットを扱う上で極めて重要である。
そこで本研究では,複数のパーティション/ランドに分割し,個別にソリューションを進化させ,最終的に移行戦略に組み込む,スケーラブルな島(iS)ベースの並列化手法を提案する。
その結果, 並列二項微分進化(P-CBDE-iS)は並列二項微分進化(P-BDE-iS)よりも良質な特徴部分集合を見出すことができた。
ロジスティック回帰(LR)はその単純さと威力のために分類器として使用される。
提案手法によって達成されたスピードアップは,その重要性を示す。
関連論文リスト
- Monte Carlo Policy Gradient Method for Binary Optimization [3.742634130733923]
パラメータ化されたポリシー分布に従って二項解をサンプリングする新しい確率モデルを開発する。
離散空間におけるコヒーレント探索には、並列マルコフ・チェイン・モンテカルロ法(MCMC)を用いる。
政策勾配法を期待する定常点への収束性を確立する。
論文 参考訳(メタデータ) (2023-07-03T07:01:42Z) - BOtied: Multi-objective Bayesian optimization with tied multivariate
ranks [49.85896045032822]
非支配解と最高多変量階との自然な関係を示し、これは合同累積分布関数(CDF)の最外層線と一致する。
我々はCDFインジケータに基づくBOtiedと呼ばれる取得関数を提案する。
論文 参考訳(メタデータ) (2023-06-01T04:50:06Z) - Deep Diversity-Enhanced Feature Representation of Hyperspectral Images [87.47202258194719]
トポロジを改良して3次元畳み込みを補正し,上行階の高次化を図る。
また、要素間の独立性を最大化するために特徴マップに作用する新しい多様性対応正規化(DA-Reg)項を提案する。
提案したRe$3$-ConvSetとDA-Regの優位性を実証するために,様々なHS画像処理および解析タスクに適用する。
論文 参考訳(メタデータ) (2023-01-15T16:19:18Z) - Sparse Quadratic Optimisation over the Stiefel Manifold with Application
to Permutation Synchronisation [71.27989298860481]
二次目的関数を最大化するスティーフェル多様体上の行列を求める非最適化問題に対処する。
そこで本研究では,支配的固有空間行列を求めるための,単純かつ効果的なスパーシティプロモーティングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-30T19:17:35Z) - Differentiable Feature Selection, a Reparameterization Approach [0.0]
本稿では,データインスタンス全体を再構成可能な機能のサブセットを選択することで構成される,再構成のための機能選択の課題について考察する。
これは、コストのかかる物理的測定、センサー配置、情報圧縮など、いくつかの文脈において特に重要である。
本研究では,本手法がデータ固有の形状を生かし,再構成を容易にすることを示す。
論文 参考訳(メタデータ) (2021-07-21T11:52:34Z) - Scalable Feature Subset Selection for Big Data using Parallel Hybrid
Evolutionary Algorithm based Wrapper in Apache Spark [4.241208172557663]
本稿では,Apache Spark環境下での並列および分散ハイブリッド進化アルゴリズム(EA)に基づく機能サブセット選択(FSS)ラッパーを提案する。
提案アルゴリズムの有効性は,サイバーセキュリティと生物学領域から得られた,様々な特徴空間次元の5つの大きなデータセットに対して検証される。
論文 参考訳(メタデータ) (2021-06-26T11:59:02Z) - Two-Stage Stochastic Optimization via Primal-Dual Decomposition and Deep
Unrolling [86.85697555068168]
2段階のアルゴリズム最適化は、様々な工学や科学的応用において重要な役割を果たす。
特に長期変数と短期変数が制約の中で結合されている場合、アルゴリズムは効率的ではない。
PDD-SSCAが既存のソリューションよりも優れたパフォーマンスを達成できることを示します。
論文 参考訳(メタデータ) (2021-05-05T03:36:00Z) - Adaptive Graph-based Generalized Regression Model for Unsupervised
Feature Selection [11.214334712819396]
非相関的かつ識別的特徴の選択は、教師なしの機能選択の重要な問題である。
非相関制約と $ell_2,1$-norm 正規化によって課される新しい一般化回帰モデルを提案する。
それは同時に同じ近所に属するこれらのデータ ポイントの分散を減らすこと無相関および差別的な特徴を選ぶことができます。
論文 参考訳(メタデータ) (2020-12-27T09:07:26Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z) - Adaptive Sampling of Pareto Frontiers with Binary Constraints Using
Regression and Classification [0.0]
本稿では,二項制約を持つブラックボックス多目的最適化問題に対する適応最適化アルゴリズムを提案する。
本手法は確率的回帰モデルと分類モデルに基づいており,最適化目標のサロゲートとして機能する。
また,予想される超体積計算を高速化するために,新しい楕円形トランケーション法を提案する。
論文 参考訳(メタデータ) (2020-08-27T09:15:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。