論文の概要: TEC: Tensor Ensemble Classifier for Big Data
- arxiv url: http://arxiv.org/abs/2103.00025v1
- Date: Fri, 26 Feb 2021 19:15:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 17:20:43.440153
- Title: TEC: Tensor Ensemble Classifier for Big Data
- Title(参考訳): TEC:Tensor Ensemble Classifier for Big Data
- Authors: Peide Li and Rejaul Karim and Tapabrata Maiti
- Abstract要約: 画像認識や高次元データ解析などの現代アプリケーションでは,STM(Support Machine)分類問題が非常に人気がある。
本研究では,大きなテンソルに対して複数のラベルを集約するEnsemble (TEC)を提案する。
理論および数値の結果は、高次元テンソル問題におけるTECモデルのまともな性能を示しています。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tensor (multidimensional array) classification problem has become very
popular in modern applications such as image recognition and high dimensional
spatio-temporal data analysis. Support Tensor Machine (STM) classifier, which
is extended from the support vector machine, takes CANDECOMP / Parafac (CP)
form of tensor data as input and predicts the data labels. The
distribution-free and statistically consistent properties of STM highlight its
potential in successfully handling wide varieties of data applications.
Training a STM can be computationally expensive with high-dimensional tensors.
However, reducing the size of tensor with a random projection technique can
reduce the computational time and cost, making it feasible to handle large size
tensors on regular machines. We name an STM estimated with randomly projected
tensor as Random Projection-based Support Tensor Machine (RPSTM). In this work,
we propose a Tensor Ensemble Classifier (TEC), which aggregates multiple RPSTMs
for big tensor classification. TEC utilizes the ensemble idea to minimize the
excessive classification risk brought by random projection, providing
statistically consistent predictions while taking the computational advantage
of RPSTM. Since each RPSTM can be estimated independently, TEC can further take
advantage of parallel computing techniques and be more computationally
efficient. The theoretical and numerical results demonstrate the decent
performance of TEC model in high-dimensional tensor classification problems.
The model prediction is statistically consistent as its risk is shown to
converge to the optimal Bayes risk. Besides, we highlight the trade-off between
the computational cost and the prediction risk for TEC model. The method is
validated by extensive simulation and a real data example. We prepare a python
package for applying TEC, which is available at our GitHub.
- Abstract(参考訳): テンソル(多次元配列)分類問題は、画像認識や高次元時空間データ解析などの現代の応用で非常に人気がある。
サポートベクターマシンから拡張されたサポートテンソルマシン(STM)分類器は、入力としてテンソルデータのCANDECOMP / Parafac(CP)形式を取り、データラベルを予測します。
STMのディストリビューションフリーで統計的に一貫性のある特性は、幅広いデータアプリケーションにうまく対応できる可能性を強調しています。
STMのトレーニングは高次元テンソルで計算コストがかかる。
しかし、ランダムプロジェクション技術によりテンソルのサイズを縮小することで、計算時間とコストを削減でき、通常のマシンで大型テンソルを扱うことが可能です。
ランダムに投影されたテンソルで推定されたSTMをRandom Projection-based Support Tensor Machine(RPSTM)と名付けた。
本研究では,大テンソル分類のための複数のRSSTMを集約したテンソルエンサンブル分類器(TEC)を提案する。
TECはアンサンブルのアイデアを利用してランダムプロジェクションによって引き起こされる過度な分類リスクを最小化し、RPSTMの計算上の利点を生かしながら統計的に一貫した予測を提供する。
各 RPSTM は独立して推定できるため、TEC はさらに並列計算技術を利用して計算効率を上げることができる。
理論的および数値的な結果は、高次元テンソル分類問題におけるTECモデルの良好な性能を示す。
モデル予測は統計的に一貫性があり、そのリスクは最適なベイズリスクに収束することが示されている。
さらに、計算コストとtecモデルの予測リスクとのトレードオフについても強調する。
この手法は、広範囲なシミュレーションと実データ例によって検証される。
TECを適用するためのpythonパッケージを用意しています。
関連論文リスト
- Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Low-Rank Tensor Function Representation for Multi-Dimensional Data
Recovery [52.21846313876592]
低ランクテンソル関数表現(LRTFR)は、無限解像度でメッシュグリッドを超えてデータを連続的に表現することができる。
テンソル関数に対する2つの基本的な概念、すなわちテンソル関数ランクとローランクテンソル関数分解を開発する。
提案手法は,最先端手法と比較して,提案手法の優越性と汎用性を裏付けるものである。
論文 参考訳(メタデータ) (2022-12-01T04:00:38Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - Truncated tensor Schatten p-norm based approach for spatiotemporal
traffic data imputation with complicated missing patterns [77.34726150561087]
本研究は, モード駆動繊維による3症例の欠失を含む, 4症例の欠失パターンについて紹介する。
本モデルでは, 目的関数の非性にもかかわらず, 乗算器の交互データ演算法を統合することにより, 最適解を導出する。
論文 参考訳(メタデータ) (2022-05-19T08:37:56Z) - Augmented Tensor Decomposition with Stochastic Optimization [46.16865811396394]
実世界のテンソルデータは、通常高次で、数百万から数十億のエントリを持つ大きな次元を持つ。
テンソル全体を従来のアルゴリズムで分解するのは高価である。
本稿では、データ拡張を効果的に取り入れて下流の分類を向上する拡張テンソル分解を提案する。
論文 参考訳(メタデータ) (2021-06-15T06:29:05Z) - A Precise Performance Analysis of Support Vector Regression [105.94855998235232]
我々は,n$の線形測定に応用したハードおよびソフトサポートベクター回帰法について検討した。
得られた結果は、ハードおよびソフトサポートベクトル回帰アルゴリズムの設計に介入するパラメータを最適に調整するために使用される。
論文 参考訳(メタデータ) (2021-05-21T14:26:28Z) - Scaling and Scalability: Provable Nonconvex Low-Rank Tensor Estimation
from Incomplete Measurements [30.395874385570007]
基本的な課題は、高度に不完全な測定からテンソルを忠実に回収することである。
タッカー分解におけるテンソル因子を直接回復するアルゴリズムを開発した。
2つの正準問題に対する基底真理テンソルの線形独立率で確実に収束することを示す。
論文 参考訳(メタデータ) (2021-04-29T17:44:49Z) - Rank-R FNN: A Tensor-Based Learning Model for High-Order Data
Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。
まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。
Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2021-04-11T16:37:32Z) - Tensor-Train Networks for Learning Predictive Modeling of
Multidimensional Data [0.0]
有望な戦略は、物理的および化学的用途で非常に成功したテンソルネットワークに基づいています。
本研究では, 多次元回帰モデルの重みをテンソルネットワークを用いて学習し, 強力なコンパクト表現を実現することを示した。
TT形式の重みを計算力の低減で近似するための最小二乗を交互に行うアルゴリズムが提案されている。
論文 参考訳(メタデータ) (2021-01-22T16:14:38Z) - Efficient Structure-preserving Support Tensor Train Machine [0.0]
列車マルチウェイマルチレベルカーネル(TT-MMK)
我々は,ポリアディック分解の単純さ,デュアル構造保存支援機の分類能力,およびTrain Vector近似の信頼性を組み合わせたTrain Multi-way Multi-level Kernel(TT-MMK)を開発した。
実験により,TT-MMK法は通常より信頼性が高く,チューニングパラメータに敏感で,他の最先端技術と比較した場合のSVM分類において高い予測精度が得られた。
論文 参考訳(メタデータ) (2020-02-12T16:35:10Z) - Sparse and Low-Rank High-Order Tensor Regression via Parallel Proximal
Method [6.381138694845438]
高次構造を持つ大規模データに対するスパース・ローランク回帰モデルを提案する。
我々のモデルはテンソル係数の空間性と低ランク性を強制する。
我々のモデルの予測は、ビデオデータセットに意味のある解釈を示す。
論文 参考訳(メタデータ) (2019-11-29T06:25:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。