論文の概要: Determination of class-specific variables in nonparametric
multiple-class classification
- arxiv url: http://arxiv.org/abs/2205.03623v1
- Date: Sat, 7 May 2022 10:08:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-15 09:26:21.346071
- Title: Determination of class-specific variables in nonparametric
multiple-class classification
- Title(参考訳): 非パラメトリック多重クラス分類におけるクラス固有変数の決定
- Authors: Wan-Ping Nicole Chen, Yuan-chin Ivan Chang
- Abstract要約: 確率に基づく非パラメトリックな多重クラス分類法を提案し、それを個々のクラスに対して高い影響変数を識別する能力と統合する。
提案手法の特性を報告し, 合成データと実データの両方を用いて, 異なる分類条件下での特性を説明する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As technology advanced, collecting data via automatic collection devices
become popular, thus we commonly face data sets with lengthy variables,
especially when these data sets are collected without specific research goals
beforehand. It has been pointed out in the literature that the difficulty of
high-dimensional classification problems is intrinsically caused by too many
noise variables useless for reducing classification error, which offer less
benefits for decision-making, and increase complexity, and confusion in
model-interpretation. A good variable selection strategy is therefore a must
for using such kinds of data well; especially when we expect to use their
results for the succeeding applications/studies, where the model-interpretation
ability is essential. hus, the conventional classification measures, such as
accuracy, sensitivity, precision, cannot be the only performance tasks. In this
paper, we propose a probability-based nonparametric multiple-class
classification method, and integrate it with the ability of identifying high
impact variables for individual class such that we can have more information
about its classification rule and the character of each class as well. The
proposed method can have its prediction power approximately equal to that of
the Bayes rule, and still retains the ability of "model-interpretation." We
report the asymptotic properties of the proposed method, and use both
synthesized and real data sets to illustrate its properties under different
classification situations. We also separately discuss the variable
identification, and training sample size determination, and summarize those
procedures as algorithms such that users can easily implement them with
different computing languages.
- Abstract(参考訳): 技術が進歩するにつれて、自動収集装置によるデータ収集が普及し、特に特定の研究目標を達成せずにこれらのデータセットを収集する場合に、長い変数を持つデータセットが一般的となる。
高い次元の分類問題の難しさは、分類誤差を減らすのに役立たないノイズ変数が多すぎることが本質的な原因で指摘されており、これは意思決定の便益を減らし、複雑さを増し、モデル解釈の混乱をもたらす。
特に、モデル解釈能力が不可欠である後続のアプリケーション/研究にそれらの結果を使用する場合は、優れた変数選択戦略が必要とされる。
husは、従来の分類手法、例えば精度、感度、正確さは、パフォーマンスタスクでは唯一のものではない。
本稿では,確率に基づく非パラメトリックな多重クラス分類法を提案し,個々のクラスに対して高い影響変数を識別し,その分類規則や各クラスの性格についてより詳細な情報を得ることができるようにした。
提案手法はベイズ法則とほぼ等しく予測能力を有し、「モデル解釈」の能力を維持している。
提案手法の漸近特性を報告し, 合成データと実データを用いて, 異なる分類条件下での特性を説明する。
また,変数の同定とサンプルサイズ決定のトレーニングを別々に議論し,ユーザが異なる計算言語で容易に実装できるように,それらの手順をアルゴリズムとして要約する。
関連論文リスト
- Probabilistic Safety Regions Via Finite Families of Scalable Classifiers [2.431537995108158]
監視された分類は、データのパターンを認識して、振る舞いのクラスを分離する。
正準解は、機械学習の数値近似の性質に固有の誤分類誤差を含む。
本稿では,確率論的安全性領域の概念を導入し,入力空間のサブセットとして,誤分類されたインスタンスの数を確率論的に制御する手法を提案する。
論文 参考訳(メタデータ) (2023-09-08T22:40:19Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Predicting Classification Accuracy When Adding New Unobserved Classes [8.325327265120283]
そこで本研究では,より大規模で未観測のクラスに対して,期待する精度を推定するために,分類器の性能をどのように利用することができるかを検討する。
ニューラルネットワークに基づく頑健なアルゴリズム "CleaneX" を定式化し,任意のサイズのクラスに対して,そのような分類器の精度を推定する。
論文 参考訳(メタデータ) (2020-10-28T14:37:25Z) - Signal classification using weighted orthogonal regression method [0.0]
本稿では,各クラス固有の構造を,対応する固有成分を介して活用する新しい分類法を提案する。
提案手法は,各サブ空間の基底を選択するために,各クラスから取得したデータのSVDによる固有ベクトルを含む。
それは、意思決定基準が2つのクラスを識別する効果的な重み付けであると考えている。
論文 参考訳(メタデータ) (2020-10-12T19:12:14Z) - Evaluating Nonlinear Decision Trees for Binary Classification Tasks with
Other Existing Methods [8.870380386952993]
データセットを2つ以上の異なるクラスに分類することは、機械学習の重要なタスクである。
多くのメソッドは、テストデータに対して非常に高い精度でバイナリ分類タスクを分類することができるが、容易に解釈可能な説明を提供することはできない。
我々は、最近提案された非線形決定木アプローチを、多くのデータセットでよく使われている分類手法で強調し、評価する。
論文 参考訳(メタデータ) (2020-08-25T00:00:23Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。