論文の概要: Polar Encoding: A Simple Baseline Approach for Classification with
Missing Values
- arxiv url: http://arxiv.org/abs/2210.01905v2
- Date: Mon, 25 Sep 2023 19:36:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 18:25:51.389201
- Title: Polar Encoding: A Simple Baseline Approach for Classification with
Missing Values
- Title(参考訳): Polar Encoding: 欠落値の分類のためのシンプルなベースラインアプローチ
- Authors: Oliver Urs Lenz, Daniel Peralta, Chris Cornelis
- Abstract要約: polar エンコーディングは $[0,1]$-valued 属性の表現で、値が欠けている。
計算を必要とせず、欠落した値が非欠落値と等価であることを保証し、決定木アルゴリズムに欠落した値を分割する方法を選択させる。
その結果, 偏極符号化性能は, チェーン型方程式 (MICE) による数値計算や, 復号化オートエンコーダ (MIDAS) による数値計算よりも優れていた。
- 参考スコア(独自算出の注目度): 1.9336815376402723
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose polar encoding, a representation of categorical and numerical
$[0,1]$-valued attributes with missing values to be used in a classification
context. We argue that this is a good baseline approach, because it can be used
with any classification algorithm, preserves missingness information, is very
simple to apply and offers good performance. In particular, unlike the existing
missing-indicator approach, it does not require imputation, ensures that
missing values are equidistant from non-missing values, and lets decision tree
algorithms choose how to split missing values, thereby providing a practical
realisation of the "missingness incorporated in attributes" (MIA) proposal.
Furthermore, we show that categorical and $[0,1]$-valued attributes can be
viewed as special cases of a single attribute type, corresponding to the
classical concept of barycentric coordinates, and that this offers a natural
interpretation of polar encoding as a fuzzified form of one-hot encoding. With
an experiment based on twenty real-life datasets with missing values, we show
that, in terms of the resulting classification performance, polar encoding
performs better than the state-of-the-art strategies \e{multiple imputation by
chained equations} (MICE) and \e{multiple imputation with denoising
autoencoders} (MIDAS) and -- depending on the classifier -- about as well or
better than mean/mode imputation with missing-indicators.
- Abstract(参考訳): 分類文脈で使用する値の欠如を伴う分類的および数値的な$[0,1]$値属性の表現である極符号化を提案する。
これは良いベースラインアプローチであり、どんな分類アルゴリズムでも使用でき、不足情報を保存でき、非常に簡単に適用でき、優れた性能を提供するからである。
特に、既存の欠落指標のアプローチとは異なり、計算を必要とせず、欠落した値が非欠落値と等価であることを保証し、決定木アルゴリズムが欠落した値を分割する方法を選択して、"属性に組み込まれた欠落"(MIA)提案を実践的に実現できるようにする。
さらに、分類的および$[0,1]$値の属性は、バリ中心座標の古典的な概念に対応する単一属性型の特別な場合と見なせることを示し、これは1ホット符号化のファジファイド形式として極符号化の自然な解釈を提供する。
値の欠落した20の実生活データセットに基づく実験では、結果の分類性能の観点から、極性エンコーディングが最先端の戦略 \e{multiple imputation by chained equation} (mice) や \e{multiple imputation with denoising autoencoders} (midas) や ----------------------または---indicator による平均/モードインプテーションよりも優れていることが示されている。
関連論文リスト
- Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Learning Confident Classifiers in the Presence of Label Noise [5.829762367794509]
本稿では,ノイズ観測のための確率論的モデルを提案し,信頼性の高い分類とセグメンテーションモデルの構築を可能にする。
実験により,本アルゴリズムは,検討された分類問題と分割問題に対して,最先端の解よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-01-02T04:27:25Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Data-Adaptive Discriminative Feature Localization with Statistically
Guaranteed Interpretation [10.122986238546492]
MNIST手書きディジットとMIT-BIH心電図信号の2つの実際のデータセットを用いて、識別的特徴の重要な特徴を動機付けている。
我々は,識別的特徴を効果的にローカライズするために,敵攻撃に基づくローカライズフレームワークを開発する。
まず,提案手法により局所化されたコンパクト画像領域を視覚的にアピールする。
第2に、同定された心電図の特徴は生物学的に可塑性であり、心電気生理学的原理と一致している。
論文 参考訳(メタデータ) (2022-11-18T07:20:00Z) - No imputation without representation [1.7205106391379026]
欠落した値は、原則として、計算によって失われる有用な情報に寄与する可能性がある。
missing-indicatorアプローチは、インプットと組み合わせて、この情報をデータセットの一部として表現することが可能になる。
この実験は、20の実生活データセットに基づいて、3つの計算戦略と様々な分類アルゴリズムに対して実施する。
論文 参考訳(メタデータ) (2022-06-28T19:12:09Z) - On the Eigenvalues of Global Covariance Pooling for Fine-grained Visual
Recognition [65.67315418971688]
グローバル共分散プーリング(GCP)の小さな固有値をトラッピングすることで、よりスムーズな勾配が得られることを示す。
きめ細かいデータセットでは、小さな固有値の切り抜きは、モデルを収束させるのに失敗する。
この観測から着想を得て,小さな固有値の重要性を拡大するネットワーク分岐を提案する。
論文 参考訳(メタデータ) (2022-05-26T11:41:36Z) - Exploring Category-correlated Feature for Few-shot Image Classification [27.13708881431794]
本稿では,従来の知識として,新しいクラスとベースクラスのカテゴリ相関を探索し,シンプルで効果的な特徴補正手法を提案する。
提案手法は, 広く使用されている3つのベンチマークにおいて, 一定の性能向上が得られる。
論文 参考訳(メタデータ) (2021-12-14T08:25:24Z) - Make an Omelette with Breaking Eggs: Zero-Shot Learning for Novel
Attribute Synthesis [65.74825840440504]
我々は,ZSLA(Zero Shot Learning for Attributes)を提案する。
提案手法は,新しい属性の検出器をゼロショット学習方式で合成することができる。
提案手法は,Caltech-UCSD Birds-200-2011データセット上の32個の属性のみを用いて,他の207個の新しい属性を合成することができる。
論文 参考訳(メタデータ) (2021-11-28T15:45:54Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Learning Gradient Boosted Multi-label Classification Rules [4.842945656927122]
本稿では,分解不能な損失関数だけでなく,分解不能な損失関数を最小化できる多ラベル分類規則の学習アルゴリズムを提案する。
我々は,合成データに対するアプローチの能力と限界を分析し,その予測性能をマルチラベルベンチマークで評価する。
論文 参考訳(メタデータ) (2020-06-23T21:39:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。