論文の概要: Multi-class Item Mining under Local Differential Privacy
- arxiv url: http://arxiv.org/abs/2504.13526v1
- Date: Fri, 18 Apr 2025 07:37:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 16:51:42.661062
- Title: Multi-class Item Mining under Local Differential Privacy
- Title(参考訳): 地域差分プライバシに基づくマルチクラスアイテムマイニング
- Authors: Yulian Mao, Qingqing Ye, Rong Du, Qi Wang, Kai Huang, Haibo Hu,
- Abstract要約: 本稿では,不正データの影響を低減するための妥当性と,ラベルとアイテムの関係を維持するための相関摂動の2つのメカニズムとともに,マルチクラスアイテムマイニングのためのフレームワークを提案する。
また、これらの最適化手法を2つのマルチクラスアイテムマイニングクエリ(周波数推定とトップ$k$アイテムマイニング)に適用する。
- 参考スコア(独自算出の注目度): 16.12696021148232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Item mining, a fundamental task for collecting statistical data from users, has raised increasing privacy concerns. To address these concerns, local differential privacy (LDP) was proposed as a privacy-preserving technique. Existing LDP item mining mechanisms primarily concentrate on global statistics, i.e., those from the entire dataset. Nevertheless, they fall short of user-tailored tasks such as personalized recommendations, whereas classwise statistics can improve task accuracy with fine-grained information. Meanwhile, the introduction of class labels brings new challenges. Label perturbation may result in invalid items for aggregation. To this end, we propose frameworks for multi-class item mining, along with two mechanisms: validity perturbation to reduce the impact of invalid data, and correlated perturbation to preserve the relationship between labels and items. We also apply these optimized methods to two multi-class item mining queries: frequency estimation and top-$k$ item mining. Through theoretical analysis and extensive experiments, we verify the effectiveness and superiority of these methods.
- Abstract(参考訳): ユーザから統計データを収集する基本的なタスクであるアイテムマイニングは、プライバシー上の懸念を高めている。
これらの懸念に対処するため、プライバシー保護手法としてローカルディファレンシャルプライバシ(LDP)が提案された。
既存のLDPアイテムマイニングメカニズムは、主にグローバル統計、すなわちデータセット全体の統計に焦点を当てている。
それでも、パーソナライズされたレコメンデーションのようなユーザーカスタマイズタスクには欠けており、クラスワイズ統計はきめ細かい情報でタスクの精度を向上させることができる。
一方、クラスラベルの導入は新たな課題をもたらす。
ラベルの摂動は、集約のための不正なアイテムをもたらす可能性がある。
そこで本研究では,無効データの影響を低減するための妥当性摂動と,ラベルとアイテムの関係を維持するための相関摂動の2つのメカニズムとともに,マルチクラスアイテムマイニングのためのフレームワークを提案する。
また、これらの最適化手法を2つのマルチクラスアイテムマイニングクエリ(周波数推定とトップ$k$アイテムマイニング)に適用する。
理論的解析と広範な実験により,これらの手法の有効性と優位性を検証した。
関連論文リスト
- TAROT: Targeted Data Selection via Optimal Transport [64.56083922130269]
TAROTは最適な輸送理論に基づくデータ選択フレームワークである。
従来のターゲットデータ選択手法は、ドメイン固有のパフォーマンスを高めるために影響に基づく欲求に依存していた。
我々は,意味的セグメンテーション,動作予測,命令チューニングなど,複数のタスクにわたるTAROTを評価する。
論文 参考訳(メタデータ) (2024-11-30T10:19:51Z) - Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - Adaptive Negative Evidential Deep Learning for Open-set Semi-supervised Learning [69.81438976273866]
オープンセット半教師付き学習(Open-set SSL)は、ラベル付きデータ(inliers)で観測されない新しいカテゴリ(outliers)を含むラベル付きデータとテストデータを含む、より実践的なシナリオである。
本研究では,様々な不確かさを定量化するための外乱検出器として顕在的深層学習(EDL)を導入し,自己学習と推論のための異なる不確実性指標を設計する。
Inlierとoutlierの両方を含むラベルなしデータセットに適合するように、新しい適応的負の最適化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-21T09:07:15Z) - MaSS: Multi-attribute Selective Suppression [8.337285030303285]
本稿では,多属性選択抑制(Multi-Atribute Selective Suppression,MASS)を提案する。
MASSは2組のネットワーク間の対戦ゲームを通じてデータ修飾子を学習する。
本研究では,異なる領域の複数のデータセットを用いて提案手法の広範な評価を行った。
論文 参考訳(メタデータ) (2022-10-18T14:44:08Z) - Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction [32.98121084823483]
本研究では,テストデータとトレーニングデータ間の分散シフトのリスクを低減するために,大量のラベルのないデータを活用することを提案する。
本稿では,無ラベルデータを利用する新しいMGCR法を提案し,TOWEに特化して2つのフィルタを設計し,異なる粒度でノイズデータをフィルタリングする。
論文 参考訳(メタデータ) (2022-08-17T13:19:26Z) - Semi-Supervised Cascaded Clustering for Classification of Noisy Label
Data [0.3441021278275805]
教師付き分類技術の性能は、データがノイズのあるラベルを持つと劣化することが多い。
ノイズの多いラベルデータに対処するアプローチのほとんどは、分類タスクに巨大なデータセットを必要とするディープニューラルネットワーク(DNN)に依存している。
パターンを抽出し、そのようなデータセットのクラスをカスケード木として生成する半教師付きカスケードクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-04T17:42:22Z) - Bayesian Semi-supervised Crowdsourcing [71.20185379303479]
クラウドソーシングは、大規模なデータセットを効率的にラベル付けし、さまざまな学習タスクを実行するための強力なパラダイムとして登場した。
この研究は、半スーパービジョンの2つの体制の下で、半教師付きクラウドソース分類を扱う。
論文 参考訳(メタデータ) (2020-12-20T23:18:51Z) - Correlated Differential Privacy: Feature Selection in Machine Learning [13.477069421691562]
提案手法は,データ相関の程度を管理し,プライバシを保護し,予測結果の正確性をサポートするための5つのステップを含む。
実験の結果,提案手法により,機械学習タスクによる予測精度が向上し,既存のスキームに比べて平均2乗誤差が少なくなることがわかった。
論文 参考訳(メタデータ) (2020-10-07T00:33:24Z) - Proposal Learning for Semi-Supervised Object Detection [76.83284279733722]
地上の真理ラベルが利用できないため、ラベルのないデータで物体検出器を訓練するのは簡単ではない。
ラベル付きデータとラベルなしデータの両方から提案特徴と予測を学習するための提案学習手法を提案する。
論文 参考訳(メタデータ) (2020-01-15T00:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。