論文の概要: StructureBoost: Efficient Gradient Boosting for Structured Categorical
Variables
- arxiv url: http://arxiv.org/abs/2007.04446v1
- Date: Wed, 8 Jul 2020 21:37:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 12:57:18.044041
- Title: StructureBoost: Efficient Gradient Boosting for Structured Categorical
Variables
- Title(参考訳): StructureBoost: 構造カテゴリー変数の効率的なグラディエントブースティング
- Authors: Brian Lucena
- Abstract要約: 本稿では,計算障害を克服し,複雑なカテゴリ変数のグラディエントブースティングを効率的に行うための2つの手法を提案する。
結果として得られたパッケージはStructureBoostと呼ばれ、CatBoostやLightGBMといった既存のパッケージよりも優れている。
本研究では、StructureBoostが、その基盤となる構造に関する知識から、目に見えないカテゴリ値の正確な予測を行うことができることを示す。
- 参考スコア(独自算出の注目度): 1.8275108630751844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gradient boosting methods based on Structured Categorical Decision Trees
(SCDT) have been demonstrated to outperform numerical and one-hot-encodings on
problems where the categorical variable has a known underlying structure.
However, the enumeration procedure in the SCDT is infeasible except for
categorical variables with low or moderate cardinality. We propose and
implement two methods to overcome the computational obstacles and efficiently
perform Gradient Boosting on complex structured categorical variables. The
resulting package, called StructureBoost, is shown to outperform established
packages such as CatBoost and LightGBM on problems with categorical predictors
that contain sophisticated structure. Moreover, we demonstrate that
StructureBoost can make accurate predictions on unseen categorical values due
to its knowledge of the underlying structure.
- Abstract(参考訳): 構造カテゴリー決定木 (SCDT) に基づくグラディエント促進法は, 分類変数が既知の基盤構造を持つ問題に対して, 数値および1ホットエンコーディングより優れることを示した。
しかし、SCDTの列挙手順は、低濃度または中等濃度のカテゴリー変数を除いて実現不可能である。
計算障害を克服する2つの手法を提案し,実装し,複雑な構造的分類変数の勾配ブースティングを効率的に行う。
結果、StructureBoostと呼ばれるパッケージは、洗練された構造を含むカテゴリ予測器の問題で、CatBoostやLightGBMのような確立したパッケージより優れていることが示されている。
さらに, 基礎構造に関する知識から, structureboost が未知の分類値を正確に予測できることを実証する。
関連論文リスト
- Reducing the dimensionality and granularity in hierarchical categorical variables [2.089191490381739]
階層型分類変数の縮小表現を求める手法を提案する。
エンティティの埋め込みが階層的な環境でどのように適用できるかを示す。
提案手法を実際のデータセットに適用し,階層構造が元の階層構造よりも改善されていることを確認する。
論文 参考訳(メタデータ) (2024-03-06T11:09:36Z) - Inducing Systematicity in Transformers by Attending to Structurally
Quantized Embeddings [60.698130703909804]
トランスフォーマーは、複雑なデータセットでトレーニングされた後、構造と実体の新規な構成に一般化する。
本稿では,SQ-Transformerを提案する。
SQ-Transformerは,複数の低複雑さ意味解析および機械翻訳データセット上で,バニラ変換器よりも強い構成一般化を実現することを示す。
論文 参考訳(メタデータ) (2024-02-09T15:53:15Z) - ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - StrAE: Autoencoding for Pre-Trained Embeddings using Explicit Structure [5.2869308707704255]
StrAEは構造化オートエンコーダフレームワークであり、明示的な構造に厳格に固執することで、マルチレベル表現の効果的な学習を可能にする。
本研究の結果は,入力として提供される構造に直接的な関連性があることを示し,既存のツリーモデルではそうではないことを示す。
次に、StrAEを拡張して、単純なローカライズ・マージアルゴリズムを用いてモデルが独自の構成を定義する。
論文 参考訳(メタデータ) (2023-05-09T16:20:48Z) - DepGraph: Towards Any Structural Pruning [68.40343338847664]
我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。
本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。
本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文 参考訳(メタデータ) (2023-01-30T14:02:33Z) - Learning Discrete Structured Variational Auto-Encoder using Natural
Evolution Strategies [40.401462193815796]
我々は、勾配のないブラックボックス最適化アルゴリズムのクラスであるNatural Evolution Strategies (NES) を用いて、離散的構造化されたVAEを学習する。
NESアルゴリズムは、フォワードパス評価のみで勾配を推定するので、計算的に魅力的である。
NES を用いた離散構造型VAE の最適化は勾配に基づく近似と同じくらい効果的であることを示す。
論文 参考訳(メタデータ) (2022-05-03T06:21:40Z) - Substructure Substitution: Structured Data Augmentation for NLP [55.69800855705232]
SUB2は、同じラベルを持つサブ構造を置換して新しい例を生成する。
より一般的なタスクでは、選挙区解析木に基づくSUB2のバリエーションを示す。
ほとんどの場合、SUB2による強化データセットによるトレーニングは、元のトレーニングセットでのトレーニングよりも優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-01-02T09:54:24Z) - A Recursive Markov Boundary-Based Approach to Causal Structure Learning [22.38302412440357]
因果構造学習のための新しい再帰型手法を提案する。
条件付き独立テストの必要回数を大幅に削減する。
実験の結果,提案アルゴリズムは,合成構造と実世界構造の両方において,最先端のアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-10-10T13:26:22Z) - ACDC: Weight Sharing in Atom-Coefficient Decomposed Convolution [57.635467829558664]
我々は,CNNにおいて,畳み込みカーネル間の構造正則化を導入する。
我々はCNNがパラメータや計算量を劇的に減らして性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-09-04T20:41:47Z) - Exploiting Categorical Structure Using Tree-Based Methods [1.8275108630751844]
分類変数の構造を表現する数学的枠組みを開発する。
この構造を利用するために決定木を一般化する方法を示す。
このアプローチは、下層の学習者として決定木を使用するグラディエントブーストツリー(Gradient Boosted Trees)のような手法に適用できる。
論文 参考訳(メタデータ) (2020-04-15T22:58:27Z) - Torch-Struct: Deep Structured Prediction Library [138.5262350501951]
本稿では,構造化予測ライブラリTorch-Structを紹介する。
Torch-Structには,シンプルで柔軟な分散ベースのAPIを通じてアクセスされる,確率的構造の広範なコレクションが含まれている。
論文 参考訳(メタデータ) (2020-02-03T16:43:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。