論文の概要: Feature space reduction method for ultrahigh-dimensional, multiclass
data: Random forest-based multiround screening (RFMS)
- arxiv url: http://arxiv.org/abs/2305.15793v1
- Date: Thu, 25 May 2023 07:16:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 16:46:21.678532
- Title: Feature space reduction method for ultrahigh-dimensional, multiclass
data: Random forest-based multiround screening (RFMS)
- Title(参考訳): 超高次元マルチクラスデータの特徴空間削減法:ランダム森林を用いたマルチラウンドスクリーニング(RFMS)
- Authors: Gergely Hancz\'ar, Marcell Stippinger, D\'avid Han\'ak, Marcell T.
Kurbucz, Oliv\'er M. T\"orteli, \'Agnes Chripk\'o, Zolt\'an Somogyv\'ari
- Abstract要約: このような状況下で効果的に適用可能な,ランダム森林を用いたマルチラウンドスクリーニング(RFMS)と呼ばれる新しい手法を提案する。
提案アルゴリズムは,特徴空間を小さなサブセットに分割し,一連の部分モデル構築を実行する。
RFMSのベンチマークには、BiometricBlenderとして知られる合成バイオメトリック特徴空間ジェネレータが使用されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, numerous screening methods have been published for
ultrahigh-dimensional data that contain hundreds of thousands of features;
however, most of these features cannot handle data with thousands of classes.
Prediction models built to authenticate users based on multichannel biometric
data result in this type of problem. In this study, we present a novel method
known as random forest-based multiround screening (RFMS) that can be
effectively applied under such circumstances. The proposed algorithm divides
the feature space into small subsets and executes a series of partial model
builds. These partial models are used to implement tournament-based sorting and
the selection of features based on their importance. To benchmark RFMS, a
synthetic biometric feature space generator known as BiometricBlender is
employed. Based on the results, the RFMS is on par with industry-standard
feature screening methods while simultaneously possessing many advantages over
these methods.
- Abstract(参考訳): 近年、何十万もの特徴を含む超高次元データに対して、多数のスクリーニング手法が公表されているが、これらの機能は数千のクラスでデータを扱うことはできない。
マルチチャネルバイオメトリックデータに基づいてユーザを認証するために構築された予測モデルは,この種の問題を引き起こす。
本研究では,この状況下で効果的に適用可能な,ランダム森林を用いたマルチラウンドスクリーニング(RFMS)と呼ばれる新しい手法を提案する。
提案アルゴリズムは,特徴空間を小さなサブセットに分割し,一連の部分モデル構築を実行する。
これらの部分モデルはトーナメントベースのソートと、その重要性に基づいた特徴の選択を実装するために使用される。
RFMSのベンチマークには、BiometricBlenderとして知られる合成バイオメトリック特徴空間ジェネレータが使用されている。
その結果,RFMSは業界標準の特徴スクリーニング手法と同等であり,同時にこれらの手法に対して多くの利点があることがわかった。
関連論文リスト
- Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Learning Large Scale Sparse Models [6.428186644949941]
サンプルの数や特徴次元が数百万から数十億にも達する大規模環境でスパースモデルを学習することを検討する。
ラッソのようなスパースモデルをオンライン的に学習し、ランダムに選択されたサンプルが1つだけ露呈してスパース勾配を更新することを提案する。
これにより、メモリコストはサンプルサイズに依存しず、1つのサンプルの勾配評価が効率的となる。
論文 参考訳(メタデータ) (2023-01-26T06:29:49Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - A Feature Selection Method for Multi-Dimension Time-Series Data [2.055949720959582]
モーションキャプチャやアクティビティ認識などのアプリケーション領域の時系列データは、しばしば多次元である。
これらのデータストリームには多くの冗長性があり、優れた分類精度は少数の機能で達成できることが多い。
相互情報に基づく多次元時系列データにおける特徴部分選択法を提案する。
論文 参考訳(メタデータ) (2021-04-22T14:49:00Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Dynamic Bayesian Approach for decision-making in Ego-Things [8.577234269009042]
本稿では,マルチセンサデータと特徴選択に基づく動的システムの異常検出手法を提案する。
成長型ニューラルガス(GNG)は、マルチセンサーデータを一連のノードにクラスタリングするために使用される。
本手法は状態推定と異常検出にマルコフジャンプ粒子フィルタ(MJPF)を用いる。
論文 参考訳(メタデータ) (2020-10-28T11:38:51Z) - Off-the-grid data-driven optimization of sampling schemes in MRI [0.0]
本稿では,MRIにおける効率よく,物理的に妥当なサンプリングパターンを生成するための,新しい学習ベースアルゴリズムを提案する。
この手法はアルゴリズムによって暗黙的に定義されたコスト関数の高次元最適化からなる。
論文 参考訳(メタデータ) (2020-10-05T07:06:39Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。