論文の概要: Random Forest Dissimilarity for High-Dimension Low Sample Size
Classification
- arxiv url: http://arxiv.org/abs/2310.14710v1
- Date: Mon, 23 Oct 2023 08:49:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 21:18:52.806371
- Title: Random Forest Dissimilarity for High-Dimension Low Sample Size
Classification
- Title(参考訳): 高次元低サンプルサイズ分類のためのランダム森林の相違
- Authors: Lucca Portes Cavalheiro, Simon Bernard, Jean Paul Barddal, Laurent
Heutte
- Abstract要約: 学習した類似度尺度は, この分類文脈に特に適しており, 正確であることを示す。
厳密な統計分析によって支援された40のパブリックHDLSS分類データセットによる実験により, RFSVM法が既存の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 3.2116198597240846
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High dimension, low sample size (HDLSS) problems are numerous among
real-world applications of machine learning. From medical images to text
processing, traditional machine learning algorithms are usually unsuccessful in
learning the best possible concept from such data. In a previous work, we
proposed a dissimilarity-based approach for multi-view classification, the
Random Forest Dissimilarity (RFD), that perfoms state-of-the-art results for
such problems. In this work, we transpose the core principle of this approach
to solving HDLSS classification problems, by using the RF similarity measure as
a learned precomputed SVM kernel (RFSVM). We show that such a learned
similarity measure is particularly suited and accurate for this classification
context. Experiments conducted on 40 public HDLSS classification datasets,
supported by rigorous statistical analyses, show that the RFSVM method
outperforms existing methods for the majority of HDLSS problems and remains at
the same time very competitive for low or non-HDLSS problems.
- Abstract(参考訳): 高次元, 低サンプルサイズ (HDLSS) 問題は, 機械学習の現実的な応用に多い。
医療画像からテキスト処理まで、従来の機械学習アルゴリズムは、そのようなデータから可能な最善の概念を学ぶのに失敗した。
前報では,多視点分類のための相似性に基づくアプローチであるランダム森林相似性(Random Forest Dissimilarity,RFD)を提案した。
本研究では、RF類似度尺度を学習前計算SVMカーネル(RFSVM)として使用することにより、HDLSS分類問題を解決するためのこのアプローチの中核となる原理を変換する。
このような学習的類似度尺度は, この分類文脈に特に適しており, 正確であることを示す。
厳密な統計分析によって支援された40の公的なHDLSS分類データセットによる実験により、RFSVM法はHDLSS問題の大部分において既存の手法よりも優れており、低あるいは非HDLSS問題に対して非常に競争力のあるままであることが示された。
関連論文リスト
- Ensemble Methods for Sequence Classification with Hidden Markov Models [8.241486511994202]
隠れマルコフモデル(HMM)のためのアンサンブル手法を用いたシーケンス分類への軽量なアプローチを提案する。
HMMは、その単純さ、解釈可能性、効率性のために、不均衡または小さいデータセットを持つシナリオにおいて、大きな利点を提供する。
アンサンブルに基づくスコアリング手法により,任意の長さのシーケンスの比較が可能となり,不均衡なデータセットの性能が向上する。
論文 参考訳(メタデータ) (2024-09-11T20:59:32Z) - High-Performance Few-Shot Segmentation with Foundation Models: An Empirical Study [64.06777376676513]
基礎モデルに基づく数ショットセグメンテーション(FSS)フレームワークを開発した。
具体的には、基礎モデルから暗黙的な知識を抽出し、粗い対応を構築するための簡単なアプローチを提案する。
2つの広く使われているデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-09-10T08:04:11Z) - Smooth Ranking SVM via Cutting-Plane Method [6.946903076677842]
我々は,AUCを最大化するために,Randing SVMと類似した切削平面法に依存するプロトタイプ学習手法を開発した。
本アルゴリズムは,切削面を反復的に導入することで,より単純なモデルを学ぶ。
73のバイナリ分類データセットを用いて行った実験から,本手法は競合する25のデータセットの中で最高のAUCが得られる。
論文 参考訳(メタデータ) (2024-01-25T18:47:23Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means
Clustering and Minimum Interlayer discrepancy [14.339674126923903]
本稿では,マルチ層ファジィc-means(MlFCM)と最小層間離散化機構(MIDMD)を用いたディープインスタンスエンベロープネットワークに基づく不均衡学習アルゴリズムを提案する。
このアルゴリズムは、事前の知識がなければ、ディープインスタンスエンベロープネットワークを使用して、高品質なバランスの取れたインスタンスを保証できる。
論文 参考訳(メタデータ) (2021-11-02T04:59:57Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Estimating Average Treatment Effects with Support Vector Machines [77.34726150561087]
サポートベクターマシン(SVM)は、機械学習文献で最も人気のある分類アルゴリズムの1つです。
我々はsvmをカーネルベースの重み付け手順として適用し,治療群と制御群の最大平均差を最小化する。
このトレードオフから生じる因果効果推定のバイアスを特徴づけ、提案されたSVM手順と既存のカーネルバランシング手法を結びつけます。
論文 参考訳(メタデータ) (2021-02-23T20:22:56Z) - Classifications based on response times for detecting early-stage
Alzheimer's disease [0.0]
本稿では,早期アルツハイマー病 (ES-AD) と健常者 (HC) の高精度な検出方法について述べる。
本論文では,手書き作業によるHC/ES-ADの分類に関する技術状況の最良の結果よりも,2~4倍の誤差を生じさせる。
論文 参考訳(メタデータ) (2021-02-01T10:08:08Z) - Population structure-learned classifier for high-dimension
low-sample-size class-imbalanced problem [3.411873646414169]
集団構造学習型分類器(PSC)を提案する。
PSCは、IHDLSS上でのより優れた一般化性能を得ることができる。
PSCはIHDLSSの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-10T08:33:39Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - MSE-Optimal Neural Network Initialization via Layer Fusion [68.72356718879428]
ディープニューラルネットワークは、さまざまな分類と推論タスクに対して最先端のパフォーマンスを達成する。
グラデーションと非進化性の組み合わせは、学習を新しい問題の影響を受けやすいものにする。
確率変数を用いて学習した深層ネットワークの近傍層を融合する手法を提案する。
論文 参考訳(メタデータ) (2020-01-28T18:25:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。