論文の概要: DPDR: A novel machine learning method for the Decision Process for
Dimensionality Reduction
- arxiv url: http://arxiv.org/abs/2206.08974v1
- Date: Fri, 17 Jun 2022 19:14:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 17:35:46.091182
- Title: DPDR: A novel machine learning method for the Decision Process for
Dimensionality Reduction
- Title(参考訳): DPDR:次元化のための決定過程のための新しい機械学習手法
- Authors: Jean-S\'ebastien Dessureault and Daniel Massicotte
- Abstract要約: 教師付き学習コンテキストにおいて、次元性を減らすための適切な方法を見つけることは、しばしば紛らわしい。
本稿では,教師付き学習文脈における最適次元削減法を選択するための新しい手法を提案する。
主なアルゴリズムはランダムフォレストアルゴリズム(RF)、主成分分析アルゴリズム(PCA)、多層パーセプトロン(MLP)ニューラルネットワークアルゴリズムである。
- 参考スコア(独自算出の注目度): 1.827510863075184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper discusses the critical decision process of extracting or selecting
the features in a supervised learning context. It is often confusing to find a
suitable method to reduce dimensionality. There are pros and cons to deciding
between a feature selection and feature extraction according to the data's
nature and the user's preferences. Indeed, the user may want to emphasize the
results toward integrity or interpretability and a specific data resolution.
This paper proposes a new method to choose the best dimensionality reduction
method in a supervised learning context. It also helps to drop or reconstruct
the features until a target resolution is reached. This target resolution can
be user-defined, or it can be automatically defined by the method. The method
applies a regression or a classification, evaluates the results, and gives a
diagnosis about the best dimensionality reduction process in this specific
supervised learning context. The main algorithms used are the Random Forest
algorithms (RF), the Principal Component Analysis (PCA) algorithm, and the
multilayer perceptron (MLP) neural network algorithm. Six use cases are
presented, and every one is based on some well-known technique to generate
synthetic data. This research discusses each choice that can be made in the
process, aiming to clarify the issues about the entire decision process of
selecting or extracting the features.
- Abstract(参考訳): 本稿では,教師付き学習コンテキストにおける特徴抽出・選択に関する決定過程について述べる。
次元を減少させる適切な方法を見つけることはしばしば混乱する。
データの性質とユーザの好みに応じて、特徴選択と特徴抽出のどちらを選択するかを決めるための長所と短所がある。
実際、ユーザは、整合性や解釈可能性、および特定のデータ解決に対する結果を強調したいかもしれない。
本稿では,教師付き学習コンテキストにおいて最良次元化手法を選択する新しい手法を提案する。
また、ターゲットの解像度に達するまで機能をドロップまたは再構築するのに役立つ。
このターゲットの解決はユーザ定義でもよいし、メソッドによって自動的に定義することもできる。
本手法は、回帰または分類を適用し、その結果を評価し、この特定の教師付き学習文脈における最良の次元減少過程を診断する。
主なアルゴリズムはランダムフォレストアルゴリズム(RF)、主成分分析アルゴリズム(PCA)、多層パーセプトロン(MLP)ニューラルネットワークアルゴリズムである。
6つのユースケースが提示され、それぞれがよく知られた合成データを生成する技術に基づいている。
本研究は、特徴の選択や抽出の過程全体に関する問題を明らかにすることを目的として、そのプロセスでできる選択について論じる。
関連論文リスト
- Online Network Source Optimization with Graph-Kernel MAB [62.6067511147939]
大規模ネットワークにおける最適なソース配置をオンラインで学習するためのグラフカーネルマルチアームバンディットアルゴリズムであるGrab-UCBを提案する。
適応グラフ辞書モデルを用いて,ネットワークプロセスを記述する。
我々は、ネットワークパラメータに依存する性能保証を導出し、シーケンシャルな意思決定戦略の学習曲線にさらに影響を及ぼす。
論文 参考訳(メタデータ) (2023-07-07T15:03:42Z) - Ideal Abstractions for Decision-Focused Learning [108.15241246054515]
本稿では,決定関連情報の損失を最小限に抑えるために,出力空間を自動的に構成する手法を提案する。
本手法は,ディープニューラルネットワークトレーニングのためのデータ取得と,閉ループ山火事管理タスクの2つの領域で実証する。
論文 参考訳(メタデータ) (2023-03-29T23:31:32Z) - R(Det)^2: Randomized Decision Routing for Object Detection [64.48369663018376]
本稿では,決定木とディープニューラルネットワークをエンドツーエンドの学習方法で組み合わせたオブジェクト検出手法を提案する。
効率的な学習を容易にするために,ノード選択型および連想型損失を伴うランダム化決定経路を提案する。
このアプローチをオブジェクト検出のためのランダム化決定ルーティングとして、R(Det)$2$と略す。
論文 参考訳(メタデータ) (2022-04-02T07:54:58Z) - Feature selection or extraction decision process for clustering using
PCA and FRSD [2.6803492658436032]
本稿では,データ科学者のパラメータに基づいて,最適次元削減法(選択・抽出)を選択する手法を提案する。
Silhouette Decomposition (FRSD) アルゴリズム、主成分分析 (PCA) アルゴリズム、K-Means アルゴリズム、およびその計量である Silhouette Index (SI) を用いる。
論文 参考訳(メタデータ) (2021-11-20T01:40:54Z) - Regret Analysis in Deterministic Reinforcement Learning [78.31410227443102]
本稿では,最適学習アルゴリズムの分析と設計の中心となる後悔の問題を考察する。
本稿では,システムパラメータに明示的に依存する対数問題固有の後悔の下位境界について述べる。
論文 参考訳(メタデータ) (2021-06-27T23:41:57Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Feature Selection Using Reinforcement Learning [0.0]
特定の関心の予測因子を特徴付けるために使用できる変数や特徴の空間は指数関数的に増大し続けている。
モデルのバイアスを損なうことなく分散を最小化する最も特徴的な特徴を特定することは、マシンラーニングモデルのトレーニングを成功させる上で非常に重要です。
論文 参考訳(メタデータ) (2021-01-23T09:24:37Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - IVFS: Simple and Efficient Feature Selection for High Dimensional
Topology Preservation [33.424663018395684]
本稿では,サンプル類似性保存を向上する簡易かつ効果的な特徴選択アルゴリズムを提案する。
提案アルゴリズムは、全データの対距離と位相パターンを適切に保存することができる。
論文 参考訳(メタデータ) (2020-04-02T23:05:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。