論文の概要: Representing missing values through polar encoding
- arxiv url: http://arxiv.org/abs/2210.01905v1
- Date: Tue, 4 Oct 2022 20:56:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 14:27:29.132594
- Title: Representing missing values through polar encoding
- Title(参考訳): 極性符号化による欠落値の表現
- Authors: Oliver Urs Lenz, Daniel Peralta, Chris Cornelis
- Abstract要約: 値が不足した$[0,1]$値属性の表現である極符号化を提案する。
既存の欠落指標のアプローチとは異なり、これは計算を必要としない。
極性符号化は、結果として得られる分類性能の点で、欠落指標のアプローチよりもほぼ同等以上の性能を示すことを示す。
- 参考スコア(独自算出の注目度): 3.6095388702618414
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose polar encoding, a representation of categorical and numerical
$[0,1]$-valued attributes with missing values that preserves the information
encoded in the distribution of the missing values. Unlike the existing
missing-indicator approach, this does not require imputation. We support our
proposal with three different arguments. Firstly, polar encoding ensures that
missing values become equidistant from all non-missing values by mapping the
latter onto the unit circle. Secondly, polar encoding lets decision trees
choose how missing values should be split, providing a practical realisation of
the missingness incorporated in attributes (MIA) proposal. And lastly, polar
encoding corresponds to the normalised representation of categorical and
$[0,1]$-valued attributes when viewed as barycentric attributes, a new concept
based on traditional barycentric coordinates. In particular, we show that
barycentric attributes are fuzzified categorical attributes, that their
normalised representation generalises one-hot encoding, and that the polar
encoding of $[0, 1]$-valued attributes is analogous to the one-hot encoding of
binary attributes. With an experiment based on twenty real-life datasets with
missing values, we show that polar encoding performs about as well or better
than the missing-indicator approach in terms of the resulting classification
performance.
- Abstract(参考訳): 本研究では, 欠落値の分布にエンコードされた情報を保存し, 欠落値を持つ, カテゴリーと数値の$[0,1]$-valued属性の表現である極性符号化を提案する。
既存の欠落指示子アプローチとは異なり、これはインプテーションを必要としない。
私たちは3つの異なる議論で提案を支持します。
第一に、極符号化は、欠落した値がすべての非欠落値から同値であることを保証する。
第二に、極性符号化により、決定木は値の分割方法を選択することができ、属性(MIA)に組み込まれた欠落を現実的に実現することができる。
最後に、極性符号化は、従来のバリ中心座標に基づく新しい概念であるバリ中心属性と見なすと、カテゴリー的および$[0,1]$値属性の正規化表現に対応する。
特に, 偏心属性はファジィ化された分類属性であり, 正規化表現は1ホット符号化を一般化し, $[0, 1]$値属性の極符号化は2値属性の1ホット符号化と類似していることを示す。
実生活における20個のデータ集合の欠落値に基づく実験により, 極性符号化は, 結果の分類性能の点で, 欠落指標法と同等かそれ以上の性能を示す。
関連論文リスト
- Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Learning Confident Classifiers in the Presence of Label Noise [5.829762367794509]
本稿では,ノイズ観測のための確率論的モデルを提案し,信頼性の高い分類とセグメンテーションモデルの構築を可能にする。
実験により,本アルゴリズムは,検討された分類問題と分割問題に対して,最先端の解よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-01-02T04:27:25Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Data-Adaptive Discriminative Feature Localization with Statistically
Guaranteed Interpretation [10.122986238546492]
MNIST手書きディジットとMIT-BIH心電図信号の2つの実際のデータセットを用いて、識別的特徴の重要な特徴を動機付けている。
我々は,識別的特徴を効果的にローカライズするために,敵攻撃に基づくローカライズフレームワークを開発する。
まず,提案手法により局所化されたコンパクト画像領域を視覚的にアピールする。
第2に、同定された心電図の特徴は生物学的に可塑性であり、心電気生理学的原理と一致している。
論文 参考訳(メタデータ) (2022-11-18T07:20:00Z) - No imputation without representation [1.7205106391379026]
欠落した値は、原則として、計算によって失われる有用な情報に寄与する可能性がある。
missing-indicatorアプローチは、インプットと組み合わせて、この情報をデータセットの一部として表現することが可能になる。
この実験は、20の実生活データセットに基づいて、3つの計算戦略と様々な分類アルゴリズムに対して実施する。
論文 参考訳(メタデータ) (2022-06-28T19:12:09Z) - On the Eigenvalues of Global Covariance Pooling for Fine-grained Visual
Recognition [65.67315418971688]
グローバル共分散プーリング(GCP)の小さな固有値をトラッピングすることで、よりスムーズな勾配が得られることを示す。
きめ細かいデータセットでは、小さな固有値の切り抜きは、モデルを収束させるのに失敗する。
この観測から着想を得て,小さな固有値の重要性を拡大するネットワーク分岐を提案する。
論文 参考訳(メタデータ) (2022-05-26T11:41:36Z) - Exploring Category-correlated Feature for Few-shot Image Classification [27.13708881431794]
本稿では,従来の知識として,新しいクラスとベースクラスのカテゴリ相関を探索し,シンプルで効果的な特徴補正手法を提案する。
提案手法は, 広く使用されている3つのベンチマークにおいて, 一定の性能向上が得られる。
論文 参考訳(メタデータ) (2021-12-14T08:25:24Z) - Make an Omelette with Breaking Eggs: Zero-Shot Learning for Novel
Attribute Synthesis [65.74825840440504]
我々は,ZSLA(Zero Shot Learning for Attributes)を提案する。
提案手法は,新しい属性の検出器をゼロショット学習方式で合成することができる。
提案手法は,Caltech-UCSD Birds-200-2011データセット上の32個の属性のみを用いて,他の207個の新しい属性を合成することができる。
論文 参考訳(メタデータ) (2021-11-28T15:45:54Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Learning Gradient Boosted Multi-label Classification Rules [4.842945656927122]
本稿では,分解不能な損失関数だけでなく,分解不能な損失関数を最小化できる多ラベル分類規則の学習アルゴリズムを提案する。
我々は,合成データに対するアプローチの能力と限界を分析し,その予測性能をマルチラベルベンチマークで評価する。
論文 参考訳(メタデータ) (2020-06-23T21:39:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。