論文の概要: Differentially Private Hierarchical Heavy Hitters
- arxiv url: http://arxiv.org/abs/2606.13563v1
- Date: Thu, 11 Jun 2026 16:48:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.926681
- Title: Differentially Private Hierarchical Heavy Hitters
- Title(参考訳): 異なる私的階層的重ヒッタ
- Authors: Ari Biswas, Graham Cormode, Yaron Kanza, Divesh Srivastava, Zhengyi Zhou,
- Abstract要約: ストリーミングと非ストリーミングの両方において,HHHリリースの差分について検討した。
非ストリーミング環境では,任意の接頭辞の残数推定における相対誤差が階層の高さとは無関係であることを示す。
この障害にもかかわらず、蒸散条件における周波数推定の絶対誤差は、利用可能な空間とは無関係であることを示す。
- 参考スコア(独自算出の注目度): 16.619509055591433
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The task of finding _Hierarchical_ Heavy Hitters (HHH) was introduced by Cormode et al. [VLDB 2003] as a generalisation of the heavy hitter problem. While finding HHH in data streams has been studied extensively, the question of releasing HHH when the underlying data is private remains unexplored. In this paper, we study differentially private HHH release in both the streaming and non-streaming setting. In the non-streaming setting, we show the surprising result that the relative error in estimating the residual count for any prefix is independent of the height of the hierarchy and the number of heavy hitters in the stream. Meanwhile, in the streaming setting, although the exact version of HHH has low global sensitivity (as counting queries are 1-sensitive), the approximation functions due to streaming have high global sensitivity, linear in the available space. Despite this obstacle, we show that the absolute error for estimating frequencies in the steaming setting is independent of the available space.
- Abstract(参考訳): Heerarchical_ Heavy Hitter (HHH) の発見は、Cormode et al (VLDB 2003) によって、重ヒッタ問題の一般化として導入された。
データストリームでHHHを見つけることは広く研究されているが、基礎となるデータがプライベートである場合のHHHのリリースに関する疑問は未解決のままである。
本稿では,ストリーミング環境と非ストリーミング環境におけるHHHリリースの差分について検討する。
非ストリーミング環境では,任意の接頭辞の残数推定における相対誤差が,階層の高さとストリーム内の重ヒット数とは無関係であることを示す。
一方、ストリーミング環境では、HHHの正確なバージョンはグローバルな感度が低く(クエリのカウントは1-センシティブなので)、ストリーミングによる近似関数はグローバルな感度が高く、利用可能な空間では線形である。
この障害にもかかわらず、蒸散条件における周波数推定の絶対誤差は、利用可能な空間とは無関係であることを示す。
関連論文リスト
- Learning Uncertainty from Sequential Internal Dispersion in Large Language Models [52.29267172760918]
不確実性推定は、大規模言語モデルにおける幻覚を検出するための有望なアプローチである。
最近の手法は一般に不確実性を推定するために内部状態のモデルに依存する。
本稿では,教師付き幻覚検出フレームワークであるシークエンシャル内部変数表現(SIVR)を提案する。
論文 参考訳(メタデータ) (2026-04-17T06:31:29Z) - Separating Oblivious and Adaptive Differential Privacy under Continual Observation [9.091518071158086]
本研究では,不明瞭な環境と適応的な環境下での連続観察下での差分プライバシーの分離の問題を示す。
我々は、入力の次元において指数関数的に多くの時間ステップに対して精度が保たれる不明瞭な設定に対して、$(varepsilon,0)$-DPアルゴリズムを提案する。
一方、各$(varepsilon,)$-DP適応アルゴリズムは、一定回数の時間ステップで出力を出力した後で正確でないことを示す。
論文 参考訳(メタデータ) (2026-03-11T17:51:35Z) - Near-Oracle KV Selection via Pre-hoc Sparsity for Long-Context Inference [54.467557491325046]
本稿では,注意スコアの前にKVエントリを選択し,明示的な精度制御を行うプリホックスパシティ(PrHS)を提案する。
PrHSは検索オーバーヘッドを90%以上削減し、HShareよりも3倍高い精度で検索できる。
これはLongBenchの平均劣化率を1%以下に抑え、FLOPを約15%減らし、9.9倍のレイテンシと2.8倍のスループットを得る。
論文 参考訳(メタデータ) (2026-02-09T07:05:23Z) - Low-Dimension-to-High-Dimension Generalization And Its Implications for Length Generalization [62.03263855004271]
LDHDの一般化は、事前知識を利用して適切な帰納バイアスを与えることなく、一般的には達成不可能であることを示す。
LDHD一般化から長さ一般化への洞察を応用して,CoTの潜在空間の変化に対する効果を説明する。
また,データ形式のような内在的なLDHD一般化とニュアンスの両方を扱うために,位置埋め込み設計の原理を提案する。
論文 参考訳(メタデータ) (2024-10-11T15:18:43Z) - Initialization Matters: Privacy-Utility Analysis of Overparameterized
Neural Networks [72.51255282371805]
我々は、最悪の近傍データセット上でのモデル分布間のKLばらつきのプライバシー境界を証明した。
このKLプライバシー境界は、トレーニング中にモデルパラメータに対して期待される2乗勾配ノルムによって決定される。
論文 参考訳(メタデータ) (2023-10-31T16:13:22Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - Differentially private multivariate medians [5.436813619675772]
差分的にプライベートな深度に基づく中央値に対する新しい有限サンプル性能保証法を開発した。
Cauchyの限界の下では、重み付けされた位置推定のコストがプライバシーのコストよりも高いことを示している。
論文 参考訳(メタデータ) (2022-10-12T17:56:04Z) - A Differentially Private Framework for Deep Learning with Convexified
Loss Functions [4.059849656394191]
差分プライバシー(DP)は、基礎となるトレーニングセットのプライバシーを保護するためにディープラーニングに応用されている。
既存のDP実践は、客観的摂動、勾配摂動、出力摂動の3つのカテゴリに分類される。
本稿では,DPノイズをランダムにサンプリングしたニューロンに注入し,新しい出力摂動機構を提案する。
論文 参考訳(メタデータ) (2022-04-03T11:10:05Z) - Interval-censored Hawkes processes [82.87738318505582]
本研究では,Hawkesプロセスのパラメータを間隔制限設定で推定するモデルを提案する。
我々は、ホークス族に対する非均質近似が、間隔検閲された設定において牽引可能な可能性を認めている方法を示す。
論文 参考訳(メタデータ) (2021-04-16T07:29:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。