論文の概要: Feature subset selection for Big Data via Chaotic Binary Differential
Evolution under Apache Spark
- arxiv url: http://arxiv.org/abs/2202.03795v1
- Date: Tue, 8 Feb 2022 11:39:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-26 09:03:30.758740
- Title: Feature subset selection for Big Data via Chaotic Binary Differential
Evolution under Apache Spark
- Title(参考訳): Apache Sparkによるカオスバイナリ微分進化によるビッグデータの特徴サブセット選択
- Authors: Yelleti Vivek, Vadlamani Ravi and P. Radhakrishna
- Abstract要約: 本稿では,基数とAUCを含む新しい乗法的単一目的関数を提案する。
二項微分進化(BDE)にロジスティックおよびテントカオス写像を組み込み、それをカオス二項微分進化(CBDE)と命名した。
その結果,P-CBDE-iS(Chaotic Binary Differential Evolution)とP-CBDE-iS(Chaotic Binary Differential Evolution)により,より高品質な特徴部分集合が得られた。
- 参考スコア(独自算出の注目度): 4.241208172557663
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feature subset selection (FSS) using a wrapper approach is essentially a
combinatorial optimization problem having two objective functions namely
cardinality of the selected-feature-subset, which should be minimized and the
corresponding area under the ROC curve (AUC) to be maximized. In this research
study, we propose a novel multiplicative single objective function involving
cardinality and AUC. The randomness involved in the Binary Differential
Evolution (BDE) may yield less diverse solutions thereby getting trapped in
local minima. Hence, we embed Logistic and Tent chaotic maps into the BDE and
named it as Chaotic Binary Differential Evolution (CBDE). Designing a scalable
solution to the FSS is critical when dealing with high-dimensional and
voluminous datasets. Hence, we propose a scalable island (iS) based
parallelization approach where the data is divided into multiple
partitions/islands thereby the solution evolves individually and gets combined
eventually in a migration strategy. The results empirically show that the
proposed parallel Chaotic Binary Differential Evolution (P-CBDE-iS) is able to
find the better quality feature subsets than the Parallel Bi-nary Differential
Evolution (P-BDE-iS). Logistic Regression (LR) is used as a classifier owing to
its simplicity and power. The speedup attained by the proposed parallel
approach signifies the importance.
- Abstract(参考訳): ラッパーアプローチを用いた特徴部分選択(FSS)は、基本的には、選択された特徴サブセットの濃度とROC曲線(AUC)の対応する領域を最大化する2つの目的関数を持つ組合せ最適化問題である。
本研究では,基数とAUCを含む新しい乗法的単一目的関数を提案する。
バイナリ微分進化(BDE)に関わるランダム性は、より多様な解をもたらすため、局所的なミニマに閉じ込められる可能性がある。
したがって、ロジスティック写像とテント写像をBDEに埋め込んで、それをCBDE(Chaotic Binary Differential Evolution)と名付けた。
FSSに対するスケーラブルなソリューションの設計は、高次元および高輝度なデータセットを扱う上で極めて重要である。
そこで本研究では,複数のパーティション/ランドに分割し,個別にソリューションを進化させ,最終的に移行戦略に組み込む,スケーラブルな島(iS)ベースの並列化手法を提案する。
その結果, 並列二項微分進化(P-CBDE-iS)は並列二項微分進化(P-BDE-iS)よりも良質な特徴部分集合を見出すことができた。
ロジスティック回帰(LR)はその単純さと威力のために分類器として使用される。
提案手法によって達成されたスピードアップは,その重要性を示す。
関連論文リスト
- Non-Dominated Sorting Bidirectional Differential Coevolution [0.0]
本稿では、微分進化(DE)を伴う双方向共進化アルゴリズム(BiCo)の変種を提案する。
このモデルの新規性には、主検索エンジンとしてのDE差分変異とクロスオーバー演算子、および非支配的なソート選択スキームが含まれる。
2つのベンチマークテストスイートと8つの実世界のCMOPの実験結果から、提案モデルが元のモデルよりも全体的な性能に到達したことが示唆された。
論文 参考訳(メタデータ) (2024-10-25T09:58:15Z) - A Stochastic Approach to Bi-Level Optimization for Hyperparameter Optimization and Meta Learning [74.80956524812714]
我々は,現代のディープラーニングにおいて広く普及している一般的なメタ学習問題に対処する。
これらの問題は、しばしばBi-Level Optimizations (BLO)として定式化される。
我々は,与えられたBLO問題を,内部損失関数が滑らかな分布となり,外損失が内部分布に対する期待損失となるようなii最適化に変換することにより,新たな視点を導入する。
論文 参考訳(メタデータ) (2024-10-14T12:10:06Z) - Variable Substitution and Bilinear Programming for Aligning Partially Overlapping Point Sets [48.1015832267945]
本研究では,RPMアルゴリズムの最小化目的関数を用いて要求を満たす手法を提案する。
分岐とバウンド(BnB)アルゴリズムが考案され、パラメータのみに分岐し、収束率を高める。
実験による評価は,非剛性変形,位置雑音,外れ値に対する提案手法の高剛性を示す。
論文 参考訳(メタデータ) (2024-05-14T13:28:57Z) - Monte Carlo Policy Gradient Method for Binary Optimization [3.742634130733923]
パラメータ化されたポリシー分布に従って二項解をサンプリングする新しい確率モデルを開発する。
離散空間におけるコヒーレント探索には、並列マルコフ・チェイン・モンテカルロ法(MCMC)を用いる。
政策勾配法を期待する定常点への収束性を確立する。
論文 参考訳(メタデータ) (2023-07-03T07:01:42Z) - Deep Diversity-Enhanced Feature Representation of Hyperspectral Images [87.47202258194719]
トポロジを改良して3次元畳み込みを補正し,上行階の高次化を図る。
また、要素間の独立性を最大化するために特徴マップに作用する新しい多様性対応正規化(DA-Reg)項を提案する。
提案したRe$3$-ConvSetとDA-Regの優位性を実証するために,様々なHS画像処理および解析タスクに適用する。
論文 参考訳(メタデータ) (2023-01-15T16:19:18Z) - Sparse Quadratic Optimisation over the Stiefel Manifold with Application
to Permutation Synchronisation [71.27989298860481]
二次目的関数を最大化するスティーフェル多様体上の行列を求める非最適化問題に対処する。
そこで本研究では,支配的固有空間行列を求めるための,単純かつ効果的なスパーシティプロモーティングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-30T19:17:35Z) - Differentiable Feature Selection, a Reparameterization Approach [0.0]
本稿では,データインスタンス全体を再構成可能な機能のサブセットを選択することで構成される,再構成のための機能選択の課題について考察する。
これは、コストのかかる物理的測定、センサー配置、情報圧縮など、いくつかの文脈において特に重要である。
本研究では,本手法がデータ固有の形状を生かし,再構成を容易にすることを示す。
論文 参考訳(メタデータ) (2021-07-21T11:52:34Z) - Scalable Feature Subset Selection for Big Data using Parallel Hybrid
Evolutionary Algorithm based Wrapper in Apache Spark [4.241208172557663]
本稿では,Apache Spark環境下での並列および分散ハイブリッド進化アルゴリズム(EA)に基づく機能サブセット選択(FSS)ラッパーを提案する。
提案アルゴリズムの有効性は,サイバーセキュリティと生物学領域から得られた,様々な特徴空間次元の5つの大きなデータセットに対して検証される。
論文 参考訳(メタデータ) (2021-06-26T11:59:02Z) - Two-Stage Stochastic Optimization via Primal-Dual Decomposition and Deep
Unrolling [86.85697555068168]
2段階のアルゴリズム最適化は、様々な工学や科学的応用において重要な役割を果たす。
特に長期変数と短期変数が制約の中で結合されている場合、アルゴリズムは効率的ではない。
PDD-SSCAが既存のソリューションよりも優れたパフォーマンスを達成できることを示します。
論文 参考訳(メタデータ) (2021-05-05T03:36:00Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。