論文の概要: Dimension Independent Data Sets Approximation and Applications to
Classification
- arxiv url: http://arxiv.org/abs/2208.13781v1
- Date: Mon, 29 Aug 2022 17:32:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-31 12:46:07.027553
- Title: Dimension Independent Data Sets Approximation and Applications to
Classification
- Title(参考訳): 次元独立データセットの近似と分類への応用
- Authors: Patrick Guidotti
- Abstract要約: 我々は、近似・補間理論の古典的カーネル法を、非常に具体的な文脈で再検討する。
データ信号と呼ばれる特別な関数は、任意のデータセットに対して定義され、教師付き分類問題を簡潔に解くために使用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We revisit the classical kernel method of approximation/interpolation theory
in a very specific context motivated by the desire to obtain a robust procedure
to approximate discrete data sets by (super)level sets of functions that are
merely continuous at the data set arguments but are otherwise smooth. Special
functions, called data signals, are defined for any given data set and are used
to succesfully solve supervised classification problems in a robust way that
depends continuously on the data set. The efficacy of the method is illustrated
with a series of low dimensional examples and by its application to the
standard benchmark high dimensional problem of MNIST digit classification.
- Abstract(参考訳): 我々は,従来のカーネルの近似・補間理論を,データセットの引数でのみ連続な関数の(超)レベル集合によって離散データセットを近似する頑健な手順を得るという欲求に動機づけられた,非常に具体的な文脈で再検討する。
データ信号と呼ばれる特殊関数は、任意のデータセットに対して定義され、データセットに依存するロバストな方法で教師付き分類問題を簡潔に解決するために使用される。
この手法の有効性は、一連の低次元の例で示され、MNIST桁分類の標準の高次元問題に応用されている。
関連論文リスト
- A Max-relevance-min-divergence Criterion for Data Discretization with
Applications on Naive Bayes [22.079025650097932]
多くの分類モデルにおいて、データはその分布をより正確に推定するために離散化される。
本稿では,識別データの識別情報と一般化能力の両方を最大化する,MDmD(Max-Dependency-Min-Divergence)基準を提案する。
本稿では,各属性を別々に識別し,識別されたデータの識別情報と一般化能力を同時に最大化することにより,より実用的なMRMD(Max-Relevance-Min-Divergence)離散化手法を提案する。
論文 参考訳(メタデータ) (2022-09-20T07:45:00Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Comparative Study of Inference Methods for Interpolative Decomposition [4.913248451323163]
補間分解(ID)学習のための自動関係決定(ARD)を用いた確率モデルを提案する。
CCLE $EC50$, CCLE $IC50$, Gene Body Methylation, promoteder Methylation datasets with different size, and dimensions。
論文 参考訳(メタデータ) (2022-06-29T11:37:05Z) - Conformalized Frequency Estimation from Sketched Data [6.510507449705344]
非常に大きなデータセットでクエリされたオブジェクトの周波数に対する信頼区間を構築するために、フレキシブルな共形推論法を開発した。
アプローチは完全にデータ適応的であり、人口分布やスケッチアルゴリズムの内部動作に関する知識を一切利用しない。
論文 参考訳(メタデータ) (2022-04-08T19:39:37Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Efficient Multidimensional Functional Data Analysis Using Marginal
Product Basis Systems [2.4554686192257424]
多次元関数データのサンプルから連続表現を学習するためのフレームワークを提案する。
本研究では, テンソル分解により, 得られた推定問題を効率的に解けることを示す。
我々は、ニューロイメージングにおける真のデータ応用で締めくくっている。
論文 参考訳(メタデータ) (2021-07-30T16:02:15Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Random extrapolation for primal-dual coordinate descent [61.55967255151027]
本稿では,データ行列の疎度と目的関数の好適な構造に適応する,ランダムに外挿した原始-双対座標降下法を提案する。
一般凸凹の場合, 主対差と目的値に対するシーケンスのほぼ確実に収束と最適サブ線形収束率を示す。
論文 参考訳(メタデータ) (2020-07-13T17:39:35Z) - A Compressive Classification Framework for High-Dimensional Data [12.284934135116515]
本稿では,データ次元がサンプルサイズよりもかなり高い設定のための圧縮分類フレームワークを提案する。
提案手法は線形判別分析に基づく正規化判別分析(CRDA)と呼ばれる。
識別規則における強しきい値化を促進するジョイントスパーシティを用いることで、重要な特徴を選択できる。
論文 参考訳(メタデータ) (2020-05-09T06:55:00Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。