論文の概要: Efficient Learning of Minimax Risk Classifiers in High Dimensions
- arxiv url: http://arxiv.org/abs/2306.06649v1
- Date: Sun, 11 Jun 2023 11:08:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-13 17:24:24.563988
- Title: Efficient Learning of Minimax Risk Classifiers in High Dimensions
- Title(参考訳): 高次元ミニマックスリスク分類器の効率的な学習
- Authors: Kartheek Bondugula and Santiago Mazuelas and Aritz P\'erez
- Abstract要約: 高次元データは、医療やゲノム学など、数万もの特徴を持つ領域で一般的である。
本稿では,このような手法を用いて,最近提案されたミニマックスリスク分類器の効率的な学習アルゴリズムを提案する。
複数の高次元データセットに対する実験により,提案アルゴリズムは高次元シナリオにおいて効率的であることが示された。
- 参考スコア(独自算出の注目度): 3.093890460224435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional data is common in multiple areas, such as health care and
genomics, where the number of features can be tens of thousands. In such
scenarios, the large number of features often leads to inefficient learning.
Constraint generation methods have recently enabled efficient learning of
L1-regularized support vector machines (SVMs). In this paper, we leverage such
methods to obtain an efficient learning algorithm for the recently proposed
minimax risk classifiers (MRCs). The proposed iterative algorithm also provides
a sequence of worst-case error probabilities and performs feature selection.
Experiments on multiple high-dimensional datasets show that the proposed
algorithm is efficient in high-dimensional scenarios. In addition, the
worst-case error probability provides useful information about the classifier
performance, and the features selected by the algorithm are competitive with
the state-of-the-art.
- Abstract(参考訳): 高次元データは、医療やゲノム学など、数万の特徴がある複数の領域で一般的である。
このようなシナリオでは、多数の機能が非効率な学習につながることが多い。
制約生成手法によりL1正規化支援ベクトルマシン(SVM)の効率的な学習が可能となった。
本稿では,最近提案されたミニマックスリスク分類器(MRC)の学習効率向上のために,そのような手法を利用する。
提案する反復アルゴリズムは,最悪の場合の誤り確率の系列を提供し,特徴選択を行う。
複数の高次元データセットに対する実験により,提案アルゴリズムは高次元シナリオにおいて効率的であることが示された。
さらに、最悪のエラー確率は分類器の性能に関する有用な情報を提供し、アルゴリズムによって選択された特徴は最先端技術と競合する。
関連論文リスト
- Machine Learning Training Optimization using the Barycentric Correction
Procedure [0.0]
本研究では,機械学習アルゴリズムとBCP(Barycentric correct procedure)と呼ばれる効率的な手法を組み合わせることを提案する。
この組み合わせによって、実データと合成データの時間に関する大きな利点が得られ、インスタンス数や次元が増加すると精度を損なうことなく得られることがわかった。
論文 参考訳(メタデータ) (2024-03-01T13:56:36Z) - Gauge-optimal approximate learning for small data classification
problems [0.0]
小さなデータ学習問題は、応答変数の観測量が限られたことと大きな特徴空間次元との相違によって特徴づけられる。
本稿では,Gauge-Optimal Approximate Learning (GOAL)アルゴリズムを提案する。
GOALは、合成データと、気候科学やバイオインフォマティクスといった現実世界の応用に挑戦する、最先端の機械学習(ML)ツールと比較されている。
論文 参考訳(メタデータ) (2023-10-29T16:46:05Z) - Spectral Entry-wise Matrix Estimation for Low-Rank Reinforcement
Learning [53.445068584013896]
低ランク構造を持つ強化学習(RL)における行列推定問題について検討した。
低ランク帯では、回収される行列は期待される腕の報酬を指定し、低ランクマルコフ決定プロセス(MDP)では、例えばMDPの遷移カーネルを特徴付ける。
簡単なスペクトルベースの行列推定手法は,行列の特異部分空間を効率よく復元し,ほぼ最小の入力誤差を示すことを示す。
論文 参考訳(メタデータ) (2023-10-10T17:06:41Z) - Best-Subset Selection in Generalized Linear Models: A Fast and
Consistent Algorithm via Splicing Technique [0.6338047104436422]
ベストサブセットセクションは、このタイプの問題の聖杯として広く見なされている。
軽度条件下での最適部分集合回復のためのアルゴリズムを提案し,提案した。
我々の実装は、一般的な変数選択ツールキットと比較して約4倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2023-08-01T03:11:31Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Large-scale Optimization of Partial AUC in a Range of False Positive
Rates [51.12047280149546]
ROC曲線 (AUC) の下の領域は、機械学習において最も広く使われている分類モデルのパフォーマンス指標の1つである。
近年の封筒平滑化技術に基づく効率的な近似勾配降下法を開発した。
提案アルゴリズムは,効率のよい解法を欠くランク付けされた範囲損失の和を最小化するためにも利用できる。
論文 参考訳(メタデータ) (2022-03-03T03:46:18Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z) - A novel embedded min-max approach for feature selection in nonlinear
support vector machine classification [0.0]
min-max最適化問題に基づく組込み特徴選択法を提案する。
双対性理論を活用することにより、min-max問題を等価に修正し、それ以上のアドを伴わずに解決する。
提案手法の効率性と有用性は,いくつかのベンチマークデータセットで検証される。
論文 参考訳(メタデータ) (2020-04-21T09:40:38Z) - IVFS: Simple and Efficient Feature Selection for High Dimensional
Topology Preservation [33.424663018395684]
本稿では,サンプル類似性保存を向上する簡易かつ効果的な特徴選択アルゴリズムを提案する。
提案アルゴリズムは、全データの対距離と位相パターンを適切に保存することができる。
論文 参考訳(メタデータ) (2020-04-02T23:05:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。