論文の概要: Reducing the dimensionality and granularity in hierarchical categorical
variables
- arxiv url: http://arxiv.org/abs/2403.03613v1
- Date: Wed, 6 Mar 2024 11:09:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 15:27:47.484028
- Title: Reducing the dimensionality and granularity in hierarchical categorical
variables
- Title(参考訳): 階層的分類変数における次元と粒度の減少
- Authors: Paul Wilsens, Katrien Antonio and Gerda Claeskens
- Abstract要約: 階層型分類変数の縮小表現を求める手法を提案する。
エンティティの埋め込みが階層的な環境でどのように適用できるかを示す。
提案手法を実際のデータセットに適用し,階層構造が元の階層構造よりも改善されていることを確認する。
- 参考スコア(独自算出の注目度): 2.348041867134616
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Hierarchical categorical variables often exhibit many levels (high
granularity) and many classes within each level (high dimensionality). This may
cause overfitting and estimation issues when including such covariates in a
predictive model. In current literature, a hierarchical covariate is often
incorporated via nested random effects. However, this does not facilitate the
assumption of classes having the same effect on the response variable. In this
paper, we propose a methodology to obtain a reduced representation of a
hierarchical categorical variable. We show how entity embedding can be applied
in a hierarchical setting. Subsequently, we propose a top-down clustering
algorithm which leverages the information encoded in the embeddings to reduce
both the within-level dimensionality as well as the overall granularity of the
hierarchical categorical variable. In simulation experiments, we show that our
methodology can effectively approximate the true underlying structure of a
hierarchical covariate in terms of the effect on a response variable, and find
that incorporating the reduced hierarchy improves model fit. We apply our
methodology on a real dataset and find that the reduced hierarchy is an
improvement over the original hierarchical structure and reduced structures
proposed in the literature.
- Abstract(参考訳): 階層的圏変数は、しばしば多くのレベル(高粒度)と各レベル(高次元性)の多くのクラスを示す。
これは、予測モデルにそのような共変量を含む場合、過剰適合と推定の問題を引き起こす可能性がある。
現在の文献では、階層的共変数はしばしばネストランダム効果によって組み込まれている。
しかし、これは応答変数に同じ影響を持つクラスの仮定を促進するものではない。
本稿では,階層的分類変数の縮小表現を得る手法を提案する。
エンティティ埋め込みが階層的な設定でどのように適用できるかを示す。
次に,埋め込みに符号化された情報を利用して,階層的分類変数の全体的粒度だけでなく,内部の次元性も低減するトップダウンクラスタリングアルゴリズムを提案する。
シミュレーション実験において,本手法は,応答変数への影響の観点から階層共変量の真の基礎構造を効果的に近似できることを示すとともに,縮小階層を組み込むことでモデル適合性が向上することを示す。
本手法を実際のデータセットに適用し,本論文で提案する階層構造と縮小構造よりも階層構造が改善されていることを確認した。
関連論文リスト
- Harnessing Superclasses for Learning from Hierarchical Databases [1.835004446596942]
多くの大規模分類問題において、クラスは既知の階層に整理され、通常木として表される。
この種の教師付き階層分類の損失について紹介する。
提案手法では,クロスエントロピーの損失に比較して,計算コストの大幅な増大は伴わない。
論文 参考訳(メタデータ) (2024-11-25T14:39:52Z) - CAVIAR: Categorical-Variable Embeddings for Accurate and Robust Inference [0.2209921757303168]
社会科学の研究は、しばしば分類変数と結果の関係に頼っている。
本稿では,高次元空間における値を仮定するカテゴリ変数を埋め込む新しい手法であるCAVIARを紹介する。
論文 参考訳(メタデータ) (2024-04-07T14:47:07Z) - Deep Imbalanced Regression via Hierarchical Classification Adjustment [50.19438850112964]
コンピュータビジョンにおける回帰タスクは、しばしば、対象空間をクラスに定量化することで分類される。
トレーニングサンプルの大多数は目標値の先頭にあるが、少数のサンプルは通常より広い尾幅に分布する。
不均衡回帰タスクを解くために階層型分類器を構築することを提案する。
不均衡回帰のための新しい階層型分類調整(HCA)は,3つのタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2023-10-26T04:54:39Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Deep Hierarchy in Bandits [51.22833900944146]
行動の報酬は、しばしば相関する。
統計的効率を最大化するためには,これらの相関を学習に活用することが重要である。
平均作用報酬の相関が階層的ベイズモデルで表されるこの問題のバンディット変法を定式化する。
論文 参考訳(メタデータ) (2022-02-03T08:15:53Z) - Label Hierarchy Transition: Delving into Class Hierarchies to Enhance
Deep Classifiers [40.993137740456014]
本稿では,階層型分類の課題に対処するために,ディープラーニングに基づく統一確率的フレームワークを提案する。
提案するフレームワークは、わずかに修正するだけで、既存のディープネットワークに容易に適応できる。
提案するLHTフレームワークを皮膚病変診断タスクに拡張し,コンピュータ支援診断におけるその大きな可能性を検証した。
論文 参考訳(メタデータ) (2021-12-04T14:58:36Z) - Inducing a hierarchy for multi-class classification problems [11.58041597483471]
分類的ラベルが自然な階層に従ったアプリケーションでは、ラベル構造を利用する分類方法は、そうでないものをしばしば上回る。
本稿では,フラット分類器に対する分類性能を向上できる階層構造を誘導する手法のクラスについて検討する。
原理シミュレーションと3つの実データアプリケーションにおいて、潜入階層の発見と精度向上のためのメソッドのクラスの有効性を実証する。
論文 参考訳(メタデータ) (2021-02-20T05:40:42Z) - Pitfalls of Assessing Extracted Hierarchies for Multi-Class
Classification [4.89253144446913]
私たちは、実践者がメソッドについて誤解を招くような結論を下すかもしれない、一般的な落とし穴を特定します。
階層の質が実験的な設定によってどう無関係になるかを示す。
その結果,多くのクラスを持つデータセットは,これらのクラスが相互に関係する複雑な構造を持つことが明らかとなった。
論文 参考訳(メタデータ) (2021-01-26T21:50:57Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Understanding and Diagnosing Vulnerability under Adversarial Attacks [62.661498155101654]
ディープニューラルネットワーク(DNN)は敵の攻撃に弱いことが知られている。
本稿では,潜在変数の分類に使用される特徴を説明するために,新しい解釈可能性手法であるInterpretGANを提案する。
また、各層がもたらす脆弱性を定量化する最初の診断方法も設計する。
論文 参考訳(メタデータ) (2020-07-17T01:56:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。