論文の概要: Semi-supervised Conditional Density Estimation for Imputation and
Classification of Incomplete Instances
- arxiv url: http://arxiv.org/abs/2106.01708v1
- Date: Thu, 3 Jun 2021 09:24:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 14:55:24.610245
- Title: Semi-supervised Conditional Density Estimation for Imputation and
Classification of Incomplete Instances
- Title(参考訳): 不完全インスタンスのインプテーションと分類のための半教師付き条件密度推定
- Authors: Buliao Huang
- Abstract要約: 本稿では,新しい条件付き正規化フロー(SSCFlow)を提案する。
SSCFlowは、観測されたラベルを明示的に利用し、同時に計算と分類を容易にする。
提案アルゴリズムの堅牢性と効率性を示すために,実世界のデータセットを用いて実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Incomplete instances with various missing attributes in many real-world
scenes have brought challenges to the classification task. There are some
missing values imputation methods to fill the missing values with substitute
values before classification. However, the separation between imputation and
classification may lead to inferior performance since label information are
ignored during imputation. Moreover, these imputation methods tend to
initialize these missing values with strong prior assumptions, while the
unreliability of such initialization is rarely considered. To tackle these
problems, a novel semi-supervised conditional normalizing flow (SSCFlow) is
proposed in this paper. SSCFlow explicitly utilizes the observed labels to
facilitate the imputation and classification simultaneously by employing a
semi-supervised algorithm to estimate the conditional probability density of
missing values. Moreover, SSCFlow takes the initialized missing values as
corrupted initial imputation and iteratively reconstructs their latent
representations with an overcomplete denoising autoencoder to approximate the
true conditional probability density of missing values. Experiments have been
conducted with real-world datasets to demonstrate the robustness and efficiency
of the proposed algorithm.
- Abstract(参考訳): 現実世界のシーンで様々な属性が欠けている不完全なインスタンスは、分類タスクに課題をもたらしました。
欠落した値を分類の前に代用値で満たすための、欠落値インプテーション法がある。
しかし,ラベル情報はインプテーション中に無視されるため,インプテーションと分類の分離は性能を低下させる可能性がある。
さらに、これらの計算手法は、これらの欠落した値を強い事前仮定で初期化する傾向があるが、そのような初期化の不確実性はほとんど考慮されない。
これらの問題に対処するために,新しい半教師付き条件正規化フロー(SSCFlow)を提案する。
sscflowは観測されたラベルを明示的に利用し、半教師付きアルゴリズムを用いて欠落値の条件付き確率密度を推定することにより、インプテーションと分類を同時に行う。
さらに、sscflowは初期化欠落値を崩壊した初期インプテーションとして捉え、その潜在表現をオーバーコンプリートデノイジングオートエンコーダで反復的に再構成し、欠落した値の真の条件付き確率密度を近似する。
提案アルゴリズムの堅牢性と効率性を示すために,実世界のデータセットを用いて実験を行った。
関連論文リスト
- Rank Suggestion in Non-negative Matrix Factorization: Residual Sensitivity to Initial Conditions (RSIC) [0.0]
我々はResidual Sensitivity to Intial Conditions (RSIC)と呼ばれる新しいアプローチを導入する。
RSICは、異なる初期化に対する相対残差の感度を分析することによって、潜在的に複数の興味の階級を提案する。
単一細胞遺伝子発現データ,画像データ,テキストデータなど,多様なデータセットを用いてRSICを評価し,現在ある最先端のランク決定手法と比較した。
論文 参考訳(メタデータ) (2024-10-18T19:18:57Z) - Adapting Fairness Interventions to Missing Values [4.820576346277399]
実世界のデータにおける値の欠落は、アルゴリズムの公正性に顕著でユニークな課題をもたらす。
最初のデータがインプットされ、次に、そのインプットされたデータが分類に使用されるような、欠落した値を扱うための標準的な手順は、識別を悪化させる。
我々は,値の欠落を伴う公平な分類のためのスケーラブルで適応的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-30T21:50:48Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Polar Encoding: A Simple Baseline Approach for Classification with Missing Values [1.7205106391379026]
polar エンコーディングは $[0,1]$-valued 属性の表現で、値が欠けている。
計算を必要とせず、欠落した値が非欠落値と等価であることを保証し、決定木アルゴリズムに欠落した値を分割する方法を選択させる。
結果として得られた分類性能において、極符号化は最先端の戦略である「連鎖方程式による多重計算」や「復号化オートエンコーダによる多重計算」よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-10-04T20:56:24Z) - Semi-supervised Contrastive Outlier removal for Pseudo Expectation
Maximization (SCOPE) [2.33877878310217]
Pseudo expectation Maximization (SCOPE) のための半教師付きコントラスト外乱除去法を用いて, 共起誤差を抑制する新しい手法を提案する。
その結果,SCOPEはベースライン上での半教師付き分類精度を大幅に向上し,さらに整合正則化と組み合わせた場合,250と4000のラベル付きサンプルを用いた半教師付きCIFAR-10分類タスクにおいて最も高い精度が得られた。
論文 参考訳(メタデータ) (2022-06-28T19:32:50Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Tomographic Auto-Encoder: Unsupervised Bayesian Recovery of Corrupted
Data [4.725669222165439]
破損したデータの教師なし回復のための新しい確率的手法を提案する。
劣化したサンプルの大規模なアンサンブルを考慮し,クリーンな値の正確な後部を復元する。
我々は、欠落した値とノイズの共通の設定の下で、データリカバリタスクでモデルをテストします。
論文 参考訳(メタデータ) (2020-06-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。