論文の概要: Data transformation based optimized customer churn prediction model for
the telecommunication industry
- arxiv url: http://arxiv.org/abs/2201.04088v1
- Date: Tue, 11 Jan 2022 17:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-12 15:01:05.866715
- Title: Data transformation based optimized customer churn prediction model for
the telecommunication industry
- Title(参考訳): 通信産業におけるデータ変換に基づく最適顧客チャーン予測モデル
- Authors: Joydeb Kumar Sana, Mohammad Zoynul Abedin, M. Sohel Rahman, M. Saifur
Rahman
- Abstract要約: 本研究は,通信産業における顧客チャーン予測(CCP)の文脈において行ったものである。
我々は,CCP問題に対するデータ変換手法と機械学習モデルを組み合わせた新しい手法を提案する。
- 参考スコア(独自算出の注目度): 1.3100459580864314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data transformation (DT) is a process that transfers the original data into a
form which supports a particular classification algorithm and helps to analyze
the data for a special purpose. To improve the prediction performance we
investigated various data transform methods. This study is conducted in a
customer churn prediction (CCP) context in the telecommunication industry
(TCI), where customer attrition is a common phenomenon. We have proposed a
novel approach of combining data transformation methods with the machine
learning models for the CCP problem. We conducted our experiments on publicly
available TCI datasets and assessed the performance in terms of the widely used
evaluation measures (e.g. AUC, precision, recall, and F-measure). In this
study, we presented comprehensive comparisons to affirm the effect of the
transformation methods. The comparison results and statistical test proved that
most of the proposed data transformation based optimized models improve the
performance of CCP significantly. Overall, an efficient and optimized CCP model
for the telecommunication industry has been presented through this manuscript.
- Abstract(参考訳): データ変換(DT)は、元のデータを特定の分類アルゴリズムをサポートする形式で転送し、特別な目的のためにデータを解析するプロセスである。
予測性能を向上させるため,様々なデータ変換法を検討した。
本研究は、顧客誘引が一般的な現象である通信産業(TCI)における顧客チャーン予測(CCP)の文脈で実施する。
本研究では, ccp問題に対するデータ変換法と機械学習モデルを組み合わせた新しい手法を提案する。
公開TIデータセットを用いて実験を行い,広く利用されている評価尺度(AUC,精度,リコール,F尺度など)を用いて評価を行った。
本研究では,変換手法の効果を確認するための包括的比較を行った。
比較結果と統計的テストの結果,提案したデータ変換に基づく最適化モデルのほとんどはCCPの性能を著しく向上させることがわかった。
全体として、この原稿を通じて、通信産業のための効率的で最適化されたCCPモデルが提示されている。
関連論文リスト
- Transfer Learning of Surrogate Models: Integrating Domain Warping and Affine Transformations [4.515998639772672]
サロゲートモデルは、計算的に要求される現実世界のプロセスに効率的な代替手段を提供する。
従来の研究では、微分可能および非微分可能サロゲートモデルの移動について研究されてきた。
本稿は、より広い範囲のトランスフォーメーションに対処することで、これまでの研究を拡張している。
論文 参考訳(メタデータ) (2025-01-30T13:46:48Z) - Accelerated Methods with Compressed Communications for Distributed Optimization Problems under Data Similarity [55.03958223190181]
本稿では,データ類似性の下での非バイアス圧縮とバイアス圧縮を利用した,理論上初めての高速化アルゴリズムを提案する。
我々の結果は、異なる平均損失とデータセットに関する実験によって記録され、確認されています。
論文 参考訳(メタデータ) (2024-12-21T00:40:58Z) - Capturing the Temporal Dependence of Training Data Influence [100.91355498124527]
我々は、訓練中にデータポイントを除去する影響を定量化する、軌跡特異的な離脱の影響の概念を定式化する。
軌道固有LOOの効率的な近似を可能にする新しい手法であるデータ値埋め込みを提案する。
データバリューの埋め込みは、トレーニングデータの順序付けをキャプチャするので、モデルトレーニングのダイナミクスに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2024-12-12T18:28:55Z) - Comparative Analysis of Transformers for Modeling Tabular Data: A
Casestudy using Industry Scale Dataset [1.0758036046280266]
この研究は、American Expressの合成データセットとデフォルト予測Kaggleデータセット(2022)の両方を用いて、様々なトランスフォーマーベースのモデルを広範囲に検証する。
本稿では、最適データ前処理に関する重要な知見を提示し、事前学習と直接教師付き学習法を比較し、分類的特徴と数値的特徴を管理するための戦略について議論し、計算資源と性能のトレードオフを強調する。
論文 参考訳(メタデータ) (2023-11-24T08:16:39Z) - Model-Contrastive Federated Domain Adaptation [3.9435648520559177]
フェデレートされたドメイン適応(FDA)は、ソースクライアント(ドメイン)から関連するが異なるターゲットクライアントに知識を協調的に転送することを目的としています。
我々は、bfコントラスト学習と視覚変換器(ViT)に基づくbfフェデレーションbfドメインbf適応に対処することを目的とした、FDACというモデルベース手法を提案する。
我々の知る限りでは、FDACはViTの潜在アーキテクチャをフェデレートされた環境下で操作することで、転送可能な表現を学習する最初の試みである。
論文 参考訳(メタデータ) (2023-05-07T23:48:03Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - DPP-based Client Selection for Federated Learning with Non-IID Data [97.1195165400568]
本稿では,統合学習(FL)のコミュニケーションボトルネックに対処するクライアント選択(CS)手法を提案する。
まず、FLにおけるCSの効果を分析し、各学習ラウンドにおけるトレーニングデータセットの多様化に参加者を適切に選択することで、FLトレーニングを加速させることができることを示す。
我々は、データプロファイリングと決定点プロセス(DPP)サンプリング技術を活用し、DPPに基づく参加者選択(FL-DP$3$S)によるフェデレートラーニング(Federated Learning)と呼ばれるアルゴリズムを開発する。
論文 参考訳(メタデータ) (2023-03-30T13:14:54Z) - Personalizing Federated Learning with Over-the-Air Computations [84.8089761800994]
フェデレートされたエッジ学習は、プライバシー保護の方法で無線ネットワークのエッジにインテリジェンスをデプロイする、有望な技術である。
このような設定の下で、複数のクライアントは、エッジサーバの調整の下でグローバルジェネリックモデルを協調的にトレーニングする。
本稿では,アナログオーバー・ザ・エア計算を用いて通信ボトルネックに対処する分散トレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-24T08:41:19Z) - A Cognitive Study on Semantic Similarity Analysis of Large Corpora: A
Transformer-based Approach [0.0]
我々は,従来の技術とトランスフォーマー技術の両方を用いて,米国特許法とPhrase Matchingデータセットのセマンティック類似性解析とモデリングを行う。
実験の結果,従来の手法と比較して手法の性能が向上し,平均ピアソン相関スコアは0.79。
論文 参考訳(メタデータ) (2022-07-24T11:06:56Z) - An Empirical Study on Distribution Shift Robustness From the Perspective
of Pre-Training and Data Augmentation [91.62129090006745]
本稿では,事前学習とデータ拡張の観点から分布シフト問題を考察する。
我々は,事前学習とデータ拡張に焦点を当てた,最初の総合的な実証的研究を行った。
論文 参考訳(メタデータ) (2022-05-25T13:04:53Z) - On the Generalization Effects of Linear Transformations in Data
Augmentation [32.01435459892255]
データ拡張は、画像やテキストの分類タスクのようなアプリケーションのパフォーマンスを改善するための強力な技術である。
我々は線形変換の族を研究し、過度にパラメータ化された線形回帰設定におけるリッジ推定器への影響について研究する。
本稿では,モデルが変換データに対してどの程度不確実であるかによって,変換空間を探索する拡張手法を提案する。
論文 参考訳(メタデータ) (2020-05-02T04:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。