論文の概要: Granular conditional entropy-based attribute reduction for partially
labeled data with proxy labels
- arxiv url: http://arxiv.org/abs/2101.09495v1
- Date: Sat, 23 Jan 2021 12:50:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 10:46:47.063562
- Title: Granular conditional entropy-based attribute reduction for partially
labeled data with proxy labels
- Title(参考訳): プロキシラベル付き部分ラベルデータに対する粒状条件エントロピーに基づく属性削減
- Authors: Can Gao, Jie Zhoua, Duoqian Miao, Xiaodong Yue, Jun Wan
- Abstract要約: 部分ラベル付きデータに対する粗い集合に基づく半教師付き属性削減法を提案する。
新たな条件エントロピー測度が提案され、理論上はその単調性が証明される。
UCIデータセットを用いた実験により,提案手法が有望であることを示す。
- 参考スコア(独自算出の注目度): 12.755874217721054
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Attribute reduction is one of the most important research topics in the
theory of rough sets, and many rough sets-based attribute reduction methods
have thus been presented. However, most of them are specifically designed for
dealing with either labeled data or unlabeled data, while many real-world
applications come in the form of partial supervision. In this paper, we propose
a rough sets-based semi-supervised attribute reduction method for partially
labeled data. Particularly, with the aid of prior class distribution
information about data, we first develop a simple yet effective strategy to
produce the proxy labels for unlabeled data. Then the concept of information
granularity is integrated into the information-theoretic measure, based on
which, a novel granular conditional entropy measure is proposed, and its
monotonicity is proved in theory. Furthermore, a fast heuristic algorithm is
provided to generate the optimal reduct of partially labeled data, which could
accelerate the process of attribute reduction by removing irrelevant examples
and excluding redundant attributes simultaneously. Extensive experiments
conducted on UCI data sets demonstrate that the proposed semi-supervised
attribute reduction method is promising and even compares favourably with the
supervised methods on labeled data and unlabeled data with true labels in terms
of classification performance.
- Abstract(参考訳): 属性還元は粗集合論において最も重要な研究テーマの一つであり,多くの粗集合に基づく属性還元法が提案されている。
しかし、その多くはラベル付きデータかラベル付きデータのいずれかを扱うために特別に設計されている。
本稿では,部分ラベル付きデータに対するラフセットに基づく半教師付き属性削減手法を提案する。
特に、データに関する事前のクラス分布情報を用いて、ラベルなしデータのプロキシラベルを生成するための簡易かつ効果的な戦略を最初に開発する。
次に、情報粒度の概念を情報理論的な尺度に統合し、それに基づいて新しい粒度条件エントロピー測度が提案され、その単調性が理論的に証明される。
さらに、部分ラベル付きデータの最適レダクトを生成するための高速ヒューリスティックアルゴリズムが提供され、無関係な例を除去し、同時に冗長な属性を除外することにより、属性削減のプロセスを加速することができる。
UCIデータセット上で行った大規模な実験により,提案手法が有望であることを示すとともに,ラベル付きデータとラベルなしデータの教師付き手法とを,分類性能の観点から比較した。
関連論文リスト
- Unsupervised Features Ranking via Coalitional Game Theory for
Categorical Data [0.28675177318965034]
教師なしの機能選択は、機能の数を減らすことを目的としている。
導出特徴の選択は、冗長率を下げる競合する手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-17T14:17:36Z) - Reprint: a randomized extrapolation based on principal components for
data augmentation [11.449992652644577]
本稿では,不均衡なデータ分類のための,シンプルで効果的な隠れ空間データ拡張手法を提案する。
各クラス内のサンプルの隠れスペース表現を与えられたREPRINTは、ランダムな方法で、ターゲットクラスの拡張例を外挿する。
この方法は、拡張例のために新しい軟質ラベルを合成できるラベル改質成分を含む。
論文 参考訳(メタデータ) (2022-04-26T01:38:47Z) - Gold Doesn't Always Glitter: Spectral Removal of Linear and Nonlinear
Guarded Attribute Information [30.495560973512358]
本稿では,神経表現から保護された情報を除去する,シンプルで効果的な手法について述べる。
本手法は特異値分解と固有値分解を用いて入力表現を方向へ投影する。
本実験は,保護された情報を取り除いた後,本アルゴリズムがより優れた主タスク性能を維持していることを示す。
論文 参考訳(メタデータ) (2022-03-15T13:40:22Z) - Learning with Noisy Labels by Targeted Relabeling [52.0329205268734]
クラウドソーシングプラットフォームは、ディープニューラルネットワークをトレーニングするためのデータセット収集によく使用される。
本稿では,少数のアノテーションを予約して,高い確率でラベル付け可能なエラーを明示的に緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T20:37:29Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - A Novel Perspective for Positive-Unlabeled Learning via Noisy Labels [49.990938653249415]
本研究では,初期疑似ラベルを雑音ラベルデータとして用いる非ラベルデータに割り当て,雑音ラベルデータを用いて深層ニューラルネットワークを訓練する手法を提案する。
実験の結果,提案手法は,いくつかのベンチマークデータセットにおいて,最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2021-03-08T11:46:02Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Semi-supervised Active Learning for Instance Segmentation via Scoring
Predictions [25.408505612498423]
インスタンスセグメンテーションのための新規かつ原則的な半教師付きアクティブ学習フレームワークを提案する。
具体的には,クラス,バウンディングボックス,マスクの手がかりを明示的に評価するトリプレットスコア予測(tsp)という不確実性サンプリング戦略を提案する。
医用画像データセットを用いた結果から,提案手法が有意義な方法で利用可能なデータから知識を具現化することを示す。
論文 参考訳(メタデータ) (2020-12-09T02:36:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。