論文の概要: Privacy-Preserving Customer Churn Prediction Model in the Context of Telecommunication Industry
- arxiv url: http://arxiv.org/abs/2411.01447v1
- Date: Sun, 03 Nov 2024 06:08:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:47:50.695986
- Title: Privacy-Preserving Customer Churn Prediction Model in the Context of Telecommunication Industry
- Title(参考訳): 通信産業におけるプライバシ保護顧客チャーン予測モデル
- Authors: Joydeb Kumar Sana, M Sohel Rahman, M Saifur Rahman,
- Abstract要約: クラウド環境におけるプライバシ保護型顧客チャーン予測モデルのためのフレームワークを提案する。
我々は,GAN(Generative Adversarial Networks)とアダプティブウェイト・オブ・エビデンス(Adaptive Weight-of-Evidence,aWOE)を組み合わせた新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 1.0428401220897083
- License:
- Abstract: Data is the main fuel of a successful machine learning model. A dataset may contain sensitive individual records e.g. personal health records, financial data, industrial information, etc. Training a model using this sensitive data has become a new privacy concern when someone uses third-party cloud computing. Trained models also suffer privacy attacks which leads to the leaking of sensitive information of the training data. This study is conducted to preserve the privacy of training data in the context of customer churn prediction modeling for the telecommunications industry (TCI). In this work, we propose a framework for privacy-preserving customer churn prediction (PPCCP) model in the cloud environment. We have proposed a novel approach which is a combination of Generative Adversarial Networks (GANs) and adaptive Weight-of-Evidence (aWOE). Synthetic data is generated from GANs, and aWOE is applied on the synthetic training dataset before feeding the data to the classification algorithms. Our experiments were carried out using eight different machine learning (ML) classifiers on three openly accessible datasets from the telecommunication sector. We then evaluated the performance using six commonly employed evaluation metrics. In addition to presenting a data privacy analysis, we also performed a statistical significance test. The training and prediction processes achieve data privacy and the prediction classifiers achieve high prediction performance (87.1\% in terms of F-Measure for GANs-aWOE based Na\"{\i}ve Bayes model). In contrast to earlier studies, our suggested approach demonstrates a prediction enhancement of up to 28.9\% and 27.9\% in terms of accuracy and F-measure, respectively.
- Abstract(参考訳): データは、成功した機械学習モデルの主要な燃料である。
データセットは、例えば個人の健康記録、財務データ、産業情報など、機密性の高い個人記録を含むことができる。
このセンシティブなデータを使用したモデルのトレーニングは、誰かがサードパーティのクラウドコンピューティングを使用するとき、新たなプライバシ上の問題となっている。
トレーニングされたモデルは、トレーニングデータの機密情報の漏洩につながるプライバシー攻撃にも悩まされる。
本研究は、電気通信業界(TCI)の顧客チャーン予測モデルにおいて、トレーニングデータのプライバシを維持するために行われた。
本研究では,クラウド環境におけるプライバシ保護型顧客チャーン予測(PPCCP)モデルを提案する。
本稿では,GAN(Generative Adversarial Networks)とアダプティブウェイト・オブ・エビデンス(Adaptive Weight-of-Evidence,aWOE)を組み合わせた新しいアプローチを提案する。
合成データは、GANから生成され、aWOEは、分類アルゴリズムにデータを供給する前に、合成トレーニングデータセットに適用される。
遠隔通信分野の3つのオープンアクセスデータセットに対して,8種類の機械学習(ML)分類器を用いて実験を行った。
次に,6つの評価指標を用いて評価を行った。
データプライバシ分析の提示に加えて,統計的意義テストも実施した。
トレーニングおよび予測プロセスはデータのプライバシを実現し、予測分類器は高い予測性能を達成する(GANs-aWOEベースのNa\"{\i}ve BayesモデルにおけるF-Measureの87.1\%)。
従来の研究とは対照的に,提案手法は精度の点で最大28.9\%と27.9\%の予測向上を示す。
関連論文リスト
- Personalized Federated Learning with Mixture of Models for Adaptive Prediction and Model Fine-Tuning [22.705411388403036]
本稿では,新しい個人化フェデレーション学習アルゴリズムを提案する。
各クライアントは、局所的に微調整されたモデルと複数のフェデレートされたモデルを組み合わせることでパーソナライズされたモデルを構築する。
実データセットに関する理論的解析と実験は、このアプローチの有効性を裏付けるものである。
論文 参考訳(メタデータ) (2024-10-28T21:20:51Z) - Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - Prompt Public Large Language Models to Synthesize Data for Private On-device Applications [5.713077600587505]
本稿では,DP と FL でトレーニングしたデバイス上での言語モデルにおいて,公開データに基づいてトレーニングした大規模言語モデル (LLM) が事前学習データの質を向上する方法について検討する。
合成データセットに事前学習したモデルでは, 単語予測精度が19.0%, 22.8%向上した。
実験では, プライベートデータにアクセスしなくても, プライベートデータに近いデータを合成する上でのLCMの強みを実証した。
論文 参考訳(メタデータ) (2024-04-05T19:14:14Z) - Approximate, Adapt, Anonymize (3A): a Framework for Privacy Preserving
Training Data Release for Machine Learning [3.29354893777827]
データリリースフレームワークである3A(Approximate, Adapt, Anonymize)を導入し、機械学習のデータユーティリティを最大化する。
本稿では,実データセットと民生データセットでトレーニングしたモデルの性能指標の相違が最小限に抑えられることを示す実験的な証拠を示す。
論文 参考訳(メタデータ) (2023-07-04T18:37:11Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - DER Forecast using Privacy Preserving Federated Learning [0.0]
分散機械学習アプローチであるFederated Learningを提案し、IoTノードのネットワークを使用してDER予測を実行する。
提案手法が消費者プライバシ保護の正確な予測に繋がることを示すため,1000 DER を含むシミュレーション研究を考察する。
論文 参考訳(メタデータ) (2021-07-07T14:25:43Z) - An Analysis of the Deployment of Models Trained on Private Tabular
Synthetic Data: Unexpected Surprises [4.129847064263057]
異なるプライベート(DP)合成データセットは、機械学習モデルをトレーニングするための強力なアプローチである。
差分プライベートな合成データ生成が分類に与える影響について検討する。
論文 参考訳(メタデータ) (2021-06-15T21:00:57Z) - Representative & Fair Synthetic Data [68.8204255655161]
公平性制約を自己監督学習プロセスに組み込むためのフレームワークを提示する。
私たちはuci成人国勢調査データセットの代表者および公正版を作成します。
我々は、代表的かつ公正な合成データを将来有望なビルディングブロックとみなし、歴史的世界ではなく、私たちが生きようとしている世界についてアルゴリズムを教える。
論文 参考訳(メタデータ) (2021-04-07T09:19:46Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。