Fugu-MT 論文翻訳(概要): Sampling Techniques in Bayesian Target Encoding

論文の概要: Sampling Techniques in Bayesian Target Encoding

arxiv url: http://arxiv.org/abs/2006.01317v2
Date: Mon, 23 Nov 2020 13:27:07 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-26 06:49:49.518061
Title: Sampling Techniques in Bayesian Target Encoding
Title（参考訳）: ベイズ目標符号化におけるサンプリング技術
Authors: Michael Larionov
Abstract要約: 本稿では,サンプリング手法を用いてベイズ符号化法をさらに発展させる。ターゲット変数のカテゴリ内分布から情報を抽出し、一般化を改善し、ターゲットリークを低減する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Target encoding is an effective encoding technique of categorical variables and is often used in machine learning systems for processing tabular data sets with mixed numeric and categorical variables. Recently en enhanced version of this encoding technique was proposed by using conjugate Bayesian modeling. This paper presents a further development of Bayesian encoding method by using sampling techniques, which helps in extracting information from intra-category distribution of the target variable, improves generalization and reduces target leakage.
Abstract（参考訳）: ターゲットエンコーディングはカテゴリ変数の効果的なエンコーディング技術であり、数値変数とカテゴリ変数を混合したテーブル型データセットを処理する機械学習システムでよく使用される。近年, 共役ベイズモデルを用いて, この符号化技術のエンエンハンスバージョンが提案されている。本稿では,対象変数のカテゴリ内分布から情報を抽出し,一般化を改善し,ターゲットリークを低減するサンプリング手法を用いてベイズ符号化法をさらに発展させる。

関連論文リスト

Distributional encoding for Gaussian process regression with qualitative inputs [0.7342677574855652]
本稿では,分布符号化(DE)に基づく一般化が,対象変数のすべてのサンプルをカテゴリとして利用することを示す。提案手法は実験的に検証され,様々な合成および実世界のデータセットに対して最先端の予測性能を示す。
論文参考訳（メタデータ） (2025-06-05T09:35:02Z)
Kernel-Based Enhanced Oversampling Method for Imbalanced Classification [10.112750055561877]
本稿では,不均衡なデータセットの分類性能を向上させるために,新しいオーバーサンプリング手法を提案する。提案手法は、凸結合とカーネルベースの重み付けを組み込むことで従来のSMOTEアルゴリズムを強化し、マイノリティクラスをより良く表現する合成サンプルを生成する。
論文参考訳（メタデータ） (2025-04-12T09:24:23Z)
Gaussian Mixture Vector Quantization with Aggregated Categorical Posterior [5.862123282894087]
ベクトル量子化変分オートエンコーダ(VQ-VAE)を導入する。 VQ-VAEは、離散埋め込みを潜時として使用する変分オートエンコーダの一種である。 GM-VQは,手工芸品に頼らずに,コードブックの利用率を向上し,情報損失を低減する。
論文参考訳（メタデータ） (2024-10-14T05:58:11Z)
Improving Transformers using Faithful Positional Encoding [55.30212768657544]
本稿では,Transformerと呼ばれるニューラルネットワークアーキテクチャのための新しい位置符号化手法を提案する。標準的な正弦波位置符号化とは違って,本手法では入力シーケンスの位置次数に関する情報が失われないようにしている。
論文参考訳（メタデータ） (2024-05-15T03:17:30Z)
Tabular Learning: Encoding for Entity and Context Embeddings [0.0]
異なるエンコーディング手法がエンティティとコンテキストの埋め込みに与える影響を調べる。複数のデータセットに異なる前処理方法とネットワークアーキテクチャを適用することで、エンコーダがネットワークの学習結果にどのように影響するかのベンチマークが得られた。
論文参考訳（メタデータ） (2024-03-28T13:29:29Z)
Branched Variational Autoencoder Classifiers [0.0]
本稿では、追加のニューラルネットワークブランチを含む変分オートエンコーダ(VAE)について紹介する。その結果、入力クラスの潜時空間分布を分離順序付けし、分類精度を向上させる。
論文参考訳（メタデータ） (2024-01-04T20:29:44Z)
Dataset Condensation with Latent Space Knowledge Factorization and Sharing [73.31614936678571]
与えられたデータセットの規則性を利用してデータセットの凝縮問題を解決する新しい手法を提案する。データセットを元の入力空間に直接凝縮するのではなく、学習可能な一連のコードでデータセットの生成プロセスを仮定する。提案手法は,様々なベンチマークデータセットに対して,有意なマージンで新しい最先端記録を達成できることを実験的に示す。
論文参考訳（メタデータ） (2022-08-21T18:14:08Z)
Variational Sparse Coding with Learned Thresholding [6.737133300781134]
サンプルをしきい値にすることでスパース分布を学習できる変分スパース符号化の新しい手法を提案する。まず,線形発生器を訓練し,その性能,統計的効率,勾配推定に優れることを示す。
論文参考訳（メタデータ） (2022-05-07T14:49:50Z)
Regularized target encoding outperforms traditional methods in supervised machine learning with high cardinality features [1.1709030738577393]
分類変数の数値表現を導出する手法を検討する。異なるエンコーディング戦略と5つの機械学習アルゴリズムを比較した。ターゲットエンコーディングの正規化バージョンが一貫して最高の結果を提供した。
論文参考訳（メタデータ） (2021-04-01T17:21:42Z)
A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文参考訳（メタデータ） (2021-02-26T17:49:58Z)
Information Theoretic Meta Learning with Gaussian Processes [74.54485310507336]
情報理論の概念,すなわち相互情報と情報のボトルネックを用いてメタ学習を定式化する。相互情報に対する変分近似を用いることで、メタ学習のための汎用的かつトラクタブルな枠組みを導出する。
論文参考訳（メタデータ） (2020-09-07T16:47:30Z)
Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文参考訳（メタデータ） (2020-05-21T06:11:33Z)
Ensemble Wrapper Subsampling for Deep Modulation Classification [70.91089216571035]
受信した無線信号のサブサンプリングは、ハードウェア要件と信号処理アルゴリズムの計算コストを緩和するために重要である。本稿では,無線通信システムにおけるディープラーニングを用いた自動変調分類のためのサブサンプリング手法を提案する。
論文参考訳（メタデータ） (2020-05-10T06:11:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。