論文の概要: On genetic programming representations and fitness functions for
interpretable dimensionality reduction
- arxiv url: http://arxiv.org/abs/2203.00528v1
- Date: Tue, 1 Mar 2022 15:12:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 15:38:33.896177
- Title: On genetic programming representations and fitness functions for
interpretable dimensionality reduction
- Title(参考訳): 解釈可能次元減少のための遺伝的プログラミング表現と適合関数について
- Authors: Thomas Uriot and Marco Virgolin and Tanja Alderliesten and Peter
Bosman
- Abstract要約: 次元減少(DR)はデータ探索と知識発見において重要な技術である。
主要なDR法のほとんどは線形(PCAなど)か、あるいは元のデータとその低次元表現との明示的なマッピングを提供しない。
近年、遺伝子プログラミング(GP)は、シンボル表現の形で解釈可能なDRマッピングの進化に用いられている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dimensionality reduction (DR) is an important technique for data exploration
and knowledge discovery. However, most of the main DR methods are either linear
(e.g., PCA), do not provide an explicit mapping between the original data and
its lower-dimensional representation (e.g., MDS, t-SNE, isomap), or produce
mappings that cannot be easily interpreted (e.g., kernel PCA, neural-based
autoencoder). Recently, genetic programming (GP) has been used to evolve
interpretable DR mappings in the form of symbolic expressions. There exists a
number of ways in which GP can be used to this end and no study exists that
performs a comparison. In this paper, we fill this gap by comparing existing GP
methods as well as devising new ones. We evaluate our methods on several
benchmark datasets based on predictive accuracy and on how well the original
features can be reconstructed using the lower-dimensional representation only.
Finally, we qualitatively assess the resulting expressions and their
complexity. We find that various GP methods can be competitive with
state-of-the-art DR algorithms and that they have the potential to produce
interpretable DR mappings.
- Abstract(参考訳): 次元減少(DR)はデータ探索と知識発見において重要な技術である。
しかし、主要なdrメソッドのほとんどは線形(例えば、pca)であり、元のデータとその低次元表現(例えば、mds、t-sne、isomap)の間の明示的なマッピングを提供していないか、容易に解釈できないマッピング(例えば、kernel pca、neural-based autoencoder)を生成する。
近年、遺伝子プログラミング(GP)は、シンボル表現の形で解釈可能なDRマッピングの進化に用いられている。
GPをこの目的に利用できる方法はいくつかあり、比較を行う研究は存在しない。
本稿では,既存のGP手法を比較し,新しい手法を考案することによって,このギャップを埋める。
提案手法は, 予測精度と低次元表現のみを用いて, 元の特徴をどの程度再構築できるかに基づいて, いくつかのベンチマークデータセット上で評価する。
最後に,結果表現とその複雑性を定性的に評価する。
様々なGP手法が最先端のDRアルゴリズムと競合し、解釈可能なDRマッピングを生成する可能性があることが判明した。
関連論文リスト
- Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Thin and Deep Gaussian Processes [43.22976185646409]
本研究は,ThinとDeep GP(TDGP)の両アプローチの新しい合成法を提案する。
また,TDGPが入力データ中の低次元多様体を特異的に検出するように調整されていること,TDGPが層数を増やすとうまく振る舞うこと,TDGPが標準ベンチマークデータセットで良好に動作すること,などを理論的および実験的に示す。
論文 参考訳(メタデータ) (2023-10-17T18:50:24Z) - Differentiable Genetic Programming for High-dimensional Symbolic
Regression [13.230237932229052]
シンボリック・レグレッション(SR)は、解釈可能な機械学習(ML)に到達するための効果的な方法と考えられている
遺伝的プログラミング(GP)は、SR問題の解決における支配者となっている。
GP木を高次元SRに向けて構築するための DGP という微分可能な手法を提案する。
論文 参考訳(メタデータ) (2023-04-18T11:39:45Z) - Dimensionality Reduction as Probabilistic Inference [10.714603218784175]
次元性低減(DR)アルゴリズムは、高次元データを低次元表現に圧縮し、データの重要な特徴を保存する。
本稿では,多種多様な古典DRアルゴリズムを確率的推論アルゴリズムとして解釈するProbDR変分フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-15T23:48:59Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - Deep Generative Symbolic Regression with Monte-Carlo-Tree-Search [29.392036559507755]
記号回帰は数値データから記号表現を学習する問題である。
手続き的に生成した合成データセットに基づいてトレーニングされたディープニューラルモデルは、競合性能を示した。
そこで本研究では,モンテカルロ木探索手法に基づいて,両世界の長所を提供する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-02-22T09:10:20Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - The Deep Generative Decoder: MAP estimation of representations improves
modeling of single-cell RNA data [0.0]
モデルパラメータと表現を直接最大後部推定(MAP)により計算する単純な生成モデルを提案する。
このアプローチの利点は、その単純さと、同等のVAEよりもはるかに小さな次元の表現を提供する能力である。
論文 参考訳(メタデータ) (2021-10-13T12:17:46Z) - Deep Representational Similarity Learning for analyzing neural
signatures in task-based fMRI dataset [81.02949933048332]
本稿では、表現類似度分析(RSA)の深部拡張であるDRSL(Deep Representational similarity Learning)を開発する。
DRSLは、多数の被験者を持つfMRIデータセットにおける様々な認知タスク間の類似性を分析するのに適している。
論文 参考訳(メタデータ) (2020-09-28T18:30:14Z) - Learning Reasoning Strategies in End-to-End Differentiable Proving [50.9791149533921]
条件付き定理プローバーは勾配に基づく最適化により最適規則選択戦略を学習する。
条件付き定理プローサは拡張性があり、CLUTRRデータセット上で最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-13T16:22:14Z) - The data-driven physical-based equations discovery using evolutionary
approach [77.34726150561087]
与えられた観測データから数学的方程式を発見するアルゴリズムについて述べる。
このアルゴリズムは遺伝的プログラミングとスパース回帰を組み合わせたものである。
解析方程式の発見や偏微分方程式(PDE)の発見にも用いられる。
論文 参考訳(メタデータ) (2020-04-03T17:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。