論文の概要: Optimal N-ary ECOC Matrices for Ensemble Classification
- arxiv url: http://arxiv.org/abs/2110.02161v1
- Date: Tue, 5 Oct 2021 16:50:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-06 13:55:04.054838
- Title: Optimal N-ary ECOC Matrices for Ensemble Classification
- Title(参考訳): アンサンブル分類のための最適N-ary ECOC行列
- Authors: Hieu D. Nguyen and Lucas J. Lavalva and Shen-Shyang Ho and Mohammed
Sarosh Khan and Nicholas Kaegi
- Abstract要約: アンサンブル分類法における誤り訂正出力符号(ECOC)の新たな構成について述べる。
任意の素数$N$が与えられたとき、この決定論的構成は基底-$N$対称二乗行列を$M$で生成する。
- 参考スコア(独自算出の注目度): 1.3561997774592662
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A new recursive construction of $N$-ary error-correcting output code (ECOC)
matrices for ensemble classification methods is presented, generalizing the
classic doubling construction for binary Hadamard matrices. Given any prime
integer $N$, this deterministic construction generates base-$N$ symmetric
square matrices $M$ of prime-power dimension having optimal minimum Hamming
distance between any two of its rows and columns. Experimental results for six
datasets demonstrate that using these deterministic coding matrices for $N$-ary
ECOC classification yields comparable and in many cases higher accuracy
compared to using randomly generated coding matrices. This is particular true
when $N$ is adaptively chosen so that the dimension of $M$ matches closely with
the number of classes in a dataset, which reduces the loss in minimum Hamming
distance when $M$ is truncated to fit the dataset. This is verified through a
distance formula for $M$ which shows that these adaptive matrices have
significantly higher minimum Hamming distance in comparison to randomly
generated ones.
- Abstract(参考訳): n$-ary エラー訂正出力コード (ecoc) のアンサンブル分類法のための再帰的構築を行い、二元アダマール行列の古典的な二重化構成を一般化した。
任意の素数 $n$ が与えられると、この決定論的構成は基数 $n$ 対称正方行列を生成し、任意の列と列の間の最小ハミング距離を持つ素数-パワー次元の m$ を生成する。
6つのデータセットに対する実験結果から、これらの決定論的符号化行列を$N$-ary ECOC分類に使用すると、ランダムに生成された符号化行列よりも高い精度が得られることが示された。
これは、$N$が適応的に選択されると、$M$の次元がデータセット内のクラス数と密接に一致し、データセットに合わせるために$M$が切り詰められたときの最小ハミング距離の損失を減らす。
これは、M$の距離公式によって検証され、これらの適応行列はランダムに生成されたものと比較して、最小ハミング距離が著しく高いことを示す。
関連論文リスト
- Optimal Sketching for Residual Error Estimation for Matrix and Vector Norms [50.15964512954274]
線形スケッチを用いた行列とベクトルノルムの残差誤差推定問題について検討する。
これは、前作とほぼ同じスケッチサイズと精度で、経験的にかなり有利であることを示す。
また、スパースリカバリ問題に対して$Omega(k2/pn1-2/p)$低いバウンダリを示し、これは$mathrmpoly(log n)$ factorまで厳密である。
論文 参考訳(メタデータ) (2024-08-16T02:33:07Z) - Private Matrix Approximation and Geometry of Unitary Orbits [29.072423395363668]
この問題は、スペクトルが$Lambda$と同じ行列で$A$を近似しようとする。
近似誤差の上限値と下限値を持つ効率的でプライベートなアルゴリズムを与える。
論文 参考訳(メタデータ) (2022-07-06T16:31:44Z) - Leverage Score Sampling for Tensor Product Matrices in Input Sparsity
Time [54.65688986250061]
我々は,$q$-foldカラムワイドテンソル積の$q$行列に対応するグラム行列を近似するための入力空間時間サンプリングアルゴリズムを提案する。
我々のサンプリング技術は、合計時間でデータセット$X$に同時に適用できる$q$部分相関ランダムプロジェクションのコレクションに依存している。
論文 参考訳(メタデータ) (2022-02-09T15:26:03Z) - Classification of high-dimensional data with spiked covariance matrix
structure [0.2741266294612775]
我々は高次元データの分類問題を$n$で研究し、$p$の特徴を観察する。
本稿では,まず,次元還元空間における分類に先立って特徴ベクトルの次元還元を行う適応型分類器を提案する。
結果の分類器は、$n rightarrow infty$ および $s sqrtn-1 ln p rightarrow 0$ のときにベイズ最適であることが示される。
論文 参考訳(メタデータ) (2021-10-05T11:26:53Z) - Unfolding Projection-free SDP Relaxation of Binary Graph Classifier via
GDPA Linearization [59.87663954467815]
アルゴリズムの展開は、モデルベースのアルゴリズムの各イテレーションをニューラルネットワーク層として実装することにより、解釈可能で類似のニューラルネットワークアーキテクチャを生成する。
本稿では、Gershgorin disc perfect alignment (GDPA)と呼ばれる最近の線形代数定理を利用して、二進グラフの半定値プログラミング緩和(SDR)のためのプロジェクションフリーアルゴリズムをアンロールする。
実験結果から,我々の未学習ネットワークは純粋モデルベースグラフ分類器よりも優れ,純粋データ駆動ネットワークに匹敵する性能を示したが,パラメータははるかに少なかった。
論文 参考訳(メタデータ) (2021-09-10T07:01:15Z) - Hashing embeddings of optimal dimension, with applications to linear
least squares [1.2891210250935143]
スケッチの射影次元$m$で最適である$sgeq 1$のスケッチ行列に対して、サブスペース埋め込み特性を提示する。
これらの結果をLinear Least Squares (LLS) の特殊なケースに適用し,これらの問題に対する汎用ソフトウェアパッケージであるSki-LLSを開発する。
論文 参考訳(メタデータ) (2021-05-25T10:35:13Z) - Householder Dice: A Matrix-Free Algorithm for Simulating Dynamics on
Gaussian and Random Orthogonal Ensembles [12.005731086591139]
Householder Dice (HD) は、高密度ランダム行列アンサンブルのダイナミクスを翻訳不変特性でシミュレートするアルゴリズムである。
HDアルゴリズムのメモリとコストはそれぞれ$mathcalO(nT)$と$mathcalO(nT2)$である。
数値結果は、高次元ランダムシステムの研究における新しい計算ツールとしてのHDアルゴリズムの約束を示しています。
論文 参考訳(メタデータ) (2021-01-19T04:50:53Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Linear-Sample Learning of Low-Rank Distributions [56.59844655107251]
ktimes k$, rank-r$, matrices to normalized $L_1$ distance requires $Omega(frackrepsilon2)$ sample。
我々は、$cal O(frackrepsilon2log2fracepsilon)$ sample, a number linear in the high dimension, and almost linear in the matrices, usually low, rank proofs.というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-30T19:10:32Z) - Compressed sensing of low-rank plus sparse matrices [3.8073142980733]
この写本は、ランクラパース行列と$sスパース行列の和として表現できる$mtimes n$が計算的に抽出可能な方法で復元可能であることを示す同様の保証を開発する。
その結果, 合成問題, 動的地上/静電分離, マルチスペクトルイメージング, ロバストPCAが得られた。
論文 参考訳(メタデータ) (2020-07-18T15:36:11Z) - Supervised Quantile Normalization for Low-rank Matrix Approximation [50.445371939523305]
我々は、$X$ の値と $UV$ の値を行ワイズで操作できる量子正規化演算子のパラメータを学習し、$X$ の低ランク表現の質を改善する。
本稿では,これらの手法が合成およびゲノムデータセットに適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-02-08T21:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。