論文の概要: Multi-class Classifier based Failure Prediction with Artificial and
Anonymous Training for Data Privacy
- arxiv url: http://arxiv.org/abs/2209.02275v1
- Date: Tue, 6 Sep 2022 07:53:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 13:15:31.464149
- Title: Multi-class Classifier based Failure Prediction with Artificial and
Anonymous Training for Data Privacy
- Title(参考訳): データプライバシのための人工匿名トレーニングによるマルチクラス分類器による故障予測
- Authors: Dibakar Das, Vikram Seshasai, Vineet Sudhir Bhat, Pushkal Juneja,
Jyotsna Bapat, Debabrata Das
- Abstract要約: 故障予測のためのニューラルネットワークに基づくマルチクラス分類器を開発した。
提案したメカニズムは、トレーニングプロセスで使用されるデータセットを、プライベートに保持されている実際のデータから完全に分離する。
その結果,異なるパラメータ構成下での故障予測の精度が向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel non-intrusive system failure prediction technique
using available information from developers and minimal information from raw
logs (rather than mining entire logs) but keeping the data entirely private
with the data owners. A neural network based multi-class classifier is
developed for failure prediction, using artificially generated anonymous data
set, applying a combination of techniques, viz., genetic algorithm (steps),
pattern repetition, etc., to train and test the network. The proposed mechanism
completely decouples the data set used for training process from the actual
data which is kept private. Moreover, multi-criteria decision making (MCDM)
schemes are used to prioritize failures meeting business requirements. Results
show high accuracy in failure prediction under different parameter
configurations. On a broader context, any classification problem, beyond
failure prediction, can be performed using the proposed mechanism with
artificially generated data set without looking into the actual data as long as
the input features can be translated to binary values (e.g. output from private
binary classifiers) and can provide classification-as-a-service.
- Abstract(参考訳): 本稿では,開発者からの利用可能な情報と(ログ全体をマイニングするのではなく)生ログからの最小限の情報を用いて,データ所有者と完全にプライベートなデータを保持する新しいシステム障害予測手法を提案する。
ニューラルネットワークを用いたマルチクラス分類器を開発し、人工的に生成された匿名データセットを用いて、アルゴリズム、遺伝的アルゴリズム(ステップ)、パターン反復などを組み合わせてネットワークを訓練し、テストする。
提案するメカニズムは、トレーニングに使用するデータセットを、プライベートに保持された実際のデータから完全に分離する。
さらに、ビジネス要件を満たす障害を優先順位付けするために、MCDM(Multi-criteria decision making)スキームが使用される。
その結果,異なるパラメータ構成下での故障予測精度が向上した。
より広い文脈では、入力特徴をバイナリ値(例えば、プライベートバイナリ分類器からの出力)に変換できる限り、実際のデータを見ることなく、人工的に生成されたデータセットで提案されたメカニズムを使って、障害予測以外の分類問題を実行し、分類・アズ・ア・サービスを提供できる。
関連論文リスト
- Approaching Metaheuristic Deep Learning Combos for Automated Data Mining [0.5419570023862531]
本研究では,メタヒューリスティック手法を従来の分類器やニューラルネットワークと組み合わせて自動データマイニングを行う手法を提案する。
手書き文字認識のためのMNISTデータセットの実験を行った。
根拠真理ラベル付きデータセットの検証精度は、これまで見つからなかった他のデータインスタンスのラベルを修正するのに不十分である、という実証的な観察がなされた。
論文 参考訳(メタデータ) (2024-10-16T10:28:22Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - Differentially Private Linear Regression with Linked Data [3.9325957466009203]
コンピュータ科学の数学的概念である差分プライバシーは、堅牢なプライバシー保証を提供する上昇するツールである。
最近の研究は、個々の統計および機械学習タスクの微分プライベートバージョンの開発に焦点を当てている。
相関データを用いた線形回帰のための2つの微分プライベートアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-01T21:00:19Z) - PEOPL: Characterizing Privately Encoded Open Datasets with Public Labels [59.66777287810985]
プライバシとユーティリティのための情報理論スコアを導入し、不誠実なユーザの平均パフォーマンスを定量化する。
次に、ランダムなディープニューラルネットワークの使用を動機付ける符号化スキームのファミリーを構築する際のプリミティブを理論的に特徴づける。
論文 参考訳(メタデータ) (2023-03-31T18:03:53Z) - Mutual Information Learned Classifiers: an Information-theoretic
Viewpoint of Training Deep Learning Classification Systems [9.660129425150926]
クロスエントロピー損失は、重度のオーバーフィッティング動作を示すモデルを見つけるのに容易である。
本稿では,既存のDNN分類器のクロスエントロピー損失最小化が,基礎となるデータ分布の条件エントロピーを本質的に学習することを証明する。
ラベルと入力の相互情報を学習することで、DNN分類器を訓練する相互情報学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-03T15:09:19Z) - Few-Shot Non-Parametric Learning with Deep Latent Variable Model [50.746273235463754]
遅延変数を用いた圧縮による非パラメトリック学習(NPC-LV)を提案する。
NPC-LVは、ラベルなしデータが多いがラベル付きデータはほとんどないデータセットの学習フレームワークである。
我々は,NPC-LVが低データ構造における画像分類における3つのデータセットの教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-23T09:35:03Z) - Uncertainty-Autoencoder-Based Privacy and Utility Preserving Data Type
Conscious Transformation [3.7315964084413173]
プライバシ・ユーティリティのトレードオフ問題に対処する逆学習フレームワークを2つの条件で提案する。
データタイプの無知な条件下では、プライバシメカニズムは、正確に1つのクラスを表す、カテゴリ機能の1ホットエンコーディングを提供する。
データ型認識条件下では、分類変数は各クラスごとに1つのスコアの集合で表される。
論文 参考訳(メタデータ) (2022-05-04T08:40:15Z) - Out-distribution aware Self-training in an Open World Setting [62.19882458285749]
オープンワールド環境ではラベルのないデータを活用して予測性能をさらに向上します。
注意深いサンプル選択戦略を含む,自己学習を意識したアウト・ディストリビューションを導入する。
当社の分類器は、設計外分布を意識しており、タスク関連の入力と無関係な入力を区別できます。
論文 参考訳(メタデータ) (2020-12-21T12:25:04Z) - Graph-Homomorphic Perturbations for Private Decentralized Learning [64.26238893241322]
ローカルな見積もりの交換は、プライベートデータに基づくデータの推測を可能にする。
すべてのエージェントで独立して選択された摂動により、パフォーマンスが著しく低下する。
本稿では,特定のヌル空間条件に従って摂動を構成する代替スキームを提案する。
論文 参考訳(メタデータ) (2020-10-23T10:35:35Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。