論文の概要: Fast Privacy-Preserving Text Classification based on Secure Multiparty
Computation
- arxiv url: http://arxiv.org/abs/2101.07365v1
- Date: Mon, 18 Jan 2021 23:08:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 05:49:28.072054
- Title: Fast Privacy-Preserving Text Classification based on Secure Multiparty
Computation
- Title(参考訳): セキュアなマルチパーティ計算に基づく高速プライバシー保護テキスト分類
- Authors: Amanda Resende, Davis Railsback, Rafael Dowsley, Anderson C. A.
Nascimento, Diego F. Aranha
- Abstract要約: プライベートテキスト分類のためのプライバシー保持型Naive Bayes分類器を提案する。
プロトコルの最後には、Aliceはテキスト入力に適用される分類器の結果のみを学習し、Bobは何も学習しない。
私たちのソリューションをスパム検出(ソリューションは汎用的で、Naive Bayes分類器が使用できる他のシナリオで使用できる)の場合に適用すると、340ms未満でSMSをスパムまたはハムとして分類できます。
- 参考スコア(独自算出の注目度): 11.65268601465649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a privacy-preserving Naive Bayes classifier and apply it to the
problem of private text classification. In this setting, a party (Alice) holds
a text message, while another party (Bob) holds a classifier. At the end of the
protocol, Alice will only learn the result of the classifier applied to her
text input and Bob learns nothing. Our solution is based on Secure Multiparty
Computation (SMC). Our Rust implementation provides a fast and secure solution
for the classification of unstructured text. Applying our solution to the case
of spam detection (the solution is generic, and can be used in any other
scenario in which the Naive Bayes classifier can be employed), we can classify
an SMS as spam or ham in less than 340ms in the case where the dictionary size
of Bob's model includes all words (n = 5200) and Alice's SMS has at most m =
160 unigrams. In the case with n = 369 and m = 8 (the average of a spam SMS in
the database), our solution takes only 21ms.
- Abstract(参考訳): 本稿では,プライバシ保存型ベイズ分類器を提案し,プライベートテキスト分類問題に適用する。
この設定では、あるパーティー(アリス)がテキストメッセージを持ち、別のパーティー(ボブ)が分類器を持っている。
プロトコルの最後には、Aliceはテキスト入力に適用される分類器の結果のみを学習し、Bobは何も学習しない。
我々のソリューションはセキュアマルチパーティ計算(SMC)に基づいている。
我々のRust実装は、構造化されていないテキストの分類のための高速でセキュアなソリューションを提供します。
スパム検出の場合(ソリューションは汎用的であり、ネイブベイズ分類器が使用できる他のシナリオで使用することができる)にソリューションを適用することで、Bobのモデルの辞書サイズがすべての単語(n = 5200)を含み、AliceのSMSが少なくともm = 160ユニグラムである場合、SMSをスパムまたはハムとして340ms未満で分類することができる。
n = 369 および m = 8 の場合(データベース内のスパムSMSの平均値)、我々のソリューションは21msしか必要としない。
関連論文リスト
- SMS Spam Detection and Classification to Combat Abuse in Telephone Networks Using Natural Language Processing [0.0]
この研究は、ユーザのプライバシーとセキュリティに脅威をもたらすSMSスパムの広範にわたる問題に対処する。
本研究では、自然言語処理(NLP)と機械学習モデル、特にスパム検出と分類にBERT(Bidirectional Representations from Transformers)を利用した新しいアプローチを提案する。
評価の結果、Na"ive Bayes + BERT"モデルは97.31%の精度で、テストデータセットでは0.3秒で実行された。
論文 参考訳(メタデータ) (2024-06-04T13:44:36Z) - Identifying Banking Transaction Descriptions via Support Vector Machine Short-Text Classification Based on a Specialized Labelled Corpus [7.046417074932257]
本稿では,自然言語処理技術と機械学習アルゴリズムを組み合わせて,銀行取引記述を分類する新しいシステムについて述べる。
また,スパム検出における既存のソリューションに触発されて,ジャカード距離に基づくトレーニングセットサイズの削減を目的とした,短いテキスト類似度検出手法を提案する。
Google PlayとApp Storeで利用可能なパーソナルファイナンスアプリケーションCoinScrapのユースケースを提示する。
論文 参考訳(メタデータ) (2024-03-29T13:15:46Z) - Protecting Copyrighted Material with Unique Identifiers in Large Language Model Training [55.321010757641524]
大きな言語モデル(LLM)のトレーニングに関する主要な公的な懸念は、著作権のあるオンラインテキストを悪用するかどうかである。
事前の会員推定法は、大量のトレーニングデータに類似した例によって誤解されることがある。
本稿では,Webユーザとコンテンツプラットフォームがtextbftextitunique 識別子を使用することを推奨する代替のtextitinsert-and-detection 手法を提案する。
論文 参考訳(メタデータ) (2024-03-23T06:36:32Z) - Towards Realistic Zero-Shot Classification via Self Structural Semantic
Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。
本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。
本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-24T17:56:46Z) - Kernel Proposal Network for Arbitrary Shape Text Detection [18.561812622368763]
任意の形状テキスト検出のための革新的カーネル提案ネットワーク(KPN)を提案する。
提案したKPNは、異なるテキストをインスタンスに依存しない機能マップに分類することで、隣接するテキストインスタンスを分離することができる。
本研究は,テキスト検出における隣接するテキストインスタンスの付着問題に対して,効率よく効果的に対処するための動的畳み込みカーネル戦略を初めて導入するものである。
論文 参考訳(メタデータ) (2022-03-12T11:02:32Z) - Quantum secure direct communication with private dense coding using
general preshared quantum state [59.99354397281036]
我々は、一般化された量子状態と高密度符号化の一般化を用いて、セキュアな直接通信を研究する。
本稿では,具体的なプロトコルを提案し,情報漏洩の上限を導出する。
論文 参考訳(メタデータ) (2021-12-30T16:12:07Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - CentripetalText: An Efficient Text Instance Representation for Scene
Text Detection [19.69057252363207]
我々はCentripetalText (CT) という名前の効率的なテキストインスタンス表現を提案する。
CTはテキストインスタンスをテキストカーネルと中心シフトの組み合わせに分解する。
シーンテキスト検出の課題に対して,本手法は既存の手法に比べて優れた,あるいは競合的な性能を発揮する。
論文 参考訳(メタデータ) (2021-07-13T09:34:18Z) - Robust and Verifiable Information Embedding Attacks to Deep Neural
Networks via Error-Correcting Codes [81.85509264573948]
ディープラーニングの時代、ユーザは、サードパーティの機械学習ツールを使用して、ディープニューラルネットワーク(DNN)分類器をトレーニングすることが多い。
情報埋め込み攻撃では、攻撃者は悪意のあるサードパーティの機械学習ツールを提供する。
本研究では,一般的なポストプロセッシング手法に対して検証可能で堅牢な情報埋め込み攻撃を設計することを目的とする。
論文 参考訳(メタデータ) (2020-10-26T17:42:42Z) - TextHide: Tackling Data Privacy in Language Understanding Tasks [54.11691303032022]
TextHideは、トレーニングを遅くしたり、精度を下げることなく、プライバシー上のリスクを軽減する。
すべての参加者は、盗聴攻撃者がプライベートテキストデータを復元するのを防ぐために、簡単な暗号化ステップを追加する必要がある。
我々は、GLUEベンチマーク上でTextHideを評価し、TextHideが共有勾配や表現に対する攻撃を効果的に防御できることを示す。
論文 参考訳(メタデータ) (2020-10-12T22:22:15Z) - Private Speech Classification with Secure Multiparty Computation [15.065527713259542]
深層学習に基づく音声分類のための最初のプライバシ保護ソリューションを提案する。
我々のアプローチでは、BobがAliceの音声信号を暗号化されていない方法で見ることなく、あるパーティの音声信号を別のパーティのディープニューラルネットワークで分類することができる。
畳み込みニューラルネットワークを用いた音声からのプライバシー保護感情検出のユースケースとして,提案手法の効率・セキュリティ・正確性トレードオフを評価する。
論文 参考訳(メタデータ) (2020-07-01T05:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。