論文の概要: Using Person Embedding to Enrich Features and Data Augmentation for
Classification
- arxiv url: http://arxiv.org/abs/2206.15162v1
- Date: Thu, 30 Jun 2022 09:48:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-01 15:13:10.825838
- Title: Using Person Embedding to Enrich Features and Data Augmentation for
Classification
- Title(参考訳): 人物埋め込みによる特徴の充実とデータ拡張による分類
- Authors: Ahmet Tu\u{g}rul Bayrak
- Abstract要約: フラッド検出分類モデルは、ケーススタディとしてラベル付きおよび不均衡データセット上に構築される。
顧客埋め込み手法は、分類モデルの成功に肯定的な影響を及ぼした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Today, machine learning is applied in almost any field. In machine learning,
where there are numerous methods, classification is one of the most basic and
crucial ones. Various problems can be solved by classification. The feature
selection for model setup is extremely important, and producing new features
via feature engineering also has a vital place in the success of the model. In
our study, fraud detection classification models are built on a labeled and
imbalanced dataset as a case-study. Although it is a natural language
processing method, a customer space has been created with word embedding, which
has been used in different areas, especially for recommender systems. The
customer vectors in the created space are fed to the classification model as a
feature. Moreover, to increase the number of positive labels, rows with similar
characteristics are re-labeled as positive by using customer similarity
determined by embedding. The model in which embedding methods are included in
the classification, which provides a better representation of customers, has
been compared with other models. Considering the results, it is observed that
the customer embedding method had a positive effect on the success of the
classification models.
- Abstract(参考訳): 今日、機械学習はほとんどあらゆる分野に適用されている。
多数の方法がある機械学習では、分類は最も基本的かつ重要なものの一つである。
様々な問題は分類によって解決できる。
モデル設定のための機能選択は極めて重要であり、機能エンジニアリングによる新機能の生成も、モデルの成功に不可欠である。
本研究では,ケーススタディとしてラベル付きおよび不均衡データセット上に不正検出分類モデルを構築した。
自然言語処理手法であるが,特にレコメンデーションシステムにおいて,様々な領域で使用されている単語埋め込みによって,顧客空間が作成されている。
生成した空間の顧客ベクトルは、特徴として分類モデルに供給されます。
さらに、正のラベル数を増やすために、埋め込みによって決定される顧客類似性を用いて、類似した特徴を持つ行を正のラベルとして再ラベルする。
顧客のより良い表現を提供する分類に埋め込み手法が組み込まれているモデルは、他のモデルと比較されている。
その結果,顧客埋め込み手法は,分類モデルの成功に肯定的な影響を及ぼすことがわかった。
関連論文リスト
- A Visual Interpretation-Based Self-Improved Classification System Using
Virtual Adversarial Training [4.722922834127293]
本稿では,仮想対人訓練(VAT)とBERTモデルを組み合わせた視覚的解釈に基づく自己改善型分類モデルを提案する。
具体的には、テキストの感情を分類するための分類器として、微調整のBERTモデルを用いる。
予測された感情分類ラベルは、半教師付き訓練方法によるスパム分類のための別のBERTの入力の一部として使用される。
論文 参考訳(メタデータ) (2023-09-03T15:07:24Z) - Learning Context-aware Classifier for Semantic Segmentation [88.88198210948426]
本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文 参考訳(メタデータ) (2023-03-21T07:00:35Z) - Class-Incremental Learning: A Survey [84.30083092434938]
CIL(Class-Incremental Learning)は、学習者が新しいクラスの知識を段階的に取り入れることを可能にする。
CILは、前者の特徴を壊滅的に忘れる傾向にあり、その性能は劇的に低下する。
ベンチマーク画像分類タスクにおける17の手法の厳密で統一的な評価を行い、異なるアルゴリズムの特徴を明らかにする。
論文 参考訳(メタデータ) (2023-02-07T17:59:05Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Fine-Grained Visual Classification using Self Assessment Classifier [12.596520707449027]
識別的特徴の抽出は、きめ細かい視覚的分類タスクにおいて重要な役割を担っている。
本稿では,画像とトップkの予測クラスを同時に活用する自己評価手法を提案する。
本手法は,CUB200-2011,Stanford Dog,FGVC Aircraft のデータセットに対して,最新の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-05-21T07:41:27Z) - Practical Active Learning with Model Selection for Small Data [13.128648437690224]
モデル選択を用いた実践的能動的学習のための簡易かつ高速な手法を開発した。
本手法は,ラジアル基底関数カーネルを用いたサポートベクトル分類を用いて,二元分類のためのプールベースアクティブラーナに基づく。
論文 参考訳(メタデータ) (2021-12-21T23:11:27Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - Informative Bayesian model selection for RR Lyrae star classifiers [0.0]
我々は,変光星分類器を評価するための情報的限界確率に基づく手法を開発した。
我々は、RRリレーの分類を訓練したベイズロジスティック回帰の集合を用いて実験を行う。
我々の手法は、天文学的知識を用いて機械学習モデルを評価するための、より厳密な代替手段を提供する。
論文 参考訳(メタデータ) (2021-05-24T20:55:04Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z) - Feature Selection Methods for Uplift Modeling and Heterogeneous
Treatment Effect [1.349645012479288]
アップリフトモデリングは、サブグループレベルの治療効果を推定する因果学習手法である。
従来の機能選択の方法は、そのタスクには適していない。
本稿では,アップリフトモデリングのための特徴選択手法を提案する。
論文 参考訳(メタデータ) (2020-05-05T00:28:18Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。