論文の概要: Core Mondrian: Basic Mondrian beyond k-anonymity
- arxiv url: http://arxiv.org/abs/2510.09661v1
- Date: Tue, 07 Oct 2025 16:47:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.531155
- Title: Core Mondrian: Basic Mondrian beyond k-anonymity
- Title(参考訳): Core Mondrian: k匿名性を超えた基本的なMondrian
- Authors: Adam Bloomston, Elizabeth Burke, Megan Cacace, Anne Diaz, Wren Dougherty, Matthew Gonzalez, Remington Gregg, Yeliz Güngör, Bryce Hayes, Eeway Hsu, Oron Israeli, Heesoo Kim, Sara Kwasnick, Joanne Lacsina, Demma Rosa Rodriguez, Adam Schiller, Whitney Schumacher, Jessica Simon, Maggie Tang, Skyler Wharton, Marilyn Wilcken,
- Abstract要約: Core Mondrianは、Original Mondrianパーティションベースの匿名化アルゴリズムの拡張である。
モジュラ戦略層はk匿名をサポートし、新しいプライバシモデルを容易に追加できる。
- 参考スコア(独自算出の注目度): 0.37413875414407155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Core Mondrian, a scalable extension of the Original Mondrian partition-based anonymization algorithm. A modular strategy layer supports k-anonymity, allowing new privacy models to be added easily. A hybrid recursive/queue execution engine exploits multi-core parallelism while maintaining deterministic output. Utility-preserving enhancements include NaN-pattern pre-partitioning, metric-driven cut scoring, and dynamic suppression budget management. Experiments on the 48k-record UCI ADULT dataset and synthetically scaled versions up to 1M records achieve lower Discernibility Metric scores than Original Mondrian for numeric quasi-identifier sets while parallel processing delivers up to 4x speedup vs. sequential Core Mondrian. Core Mondrian enables privacy-compliant equity analytics at production scale.
- Abstract(参考訳): 我々は、Original Mondrianパーティションベースの匿名化アルゴリズムのスケーラブルな拡張であるCore Mondrianを紹介する。
モジュラ戦略層はk匿名をサポートし、新しいプライバシモデルを容易に追加できる。
ハイブリッド再帰/キュー実行エンジンは、決定論的出力を維持しながらマルチコア並列性を利用する。
ユーティリティ保護の強化には、NaNパターンの事前分割、メトリック駆動のカットスコア、動的抑制予算管理などがある。
48k-record UCI ADULTデータセットと100万レコードまで合成スケールされたバージョンによる実験は、数値準識別器セットにおいて、オリジナルモンドリアンよりも低い識別率のスコアを得る一方、並列処理は、シーケンシャルコアモンドリアンに比べて最大4倍のスピードアップを提供する。
Core Mondrianは、プライバシ準拠のエクイティ分析をプロダクションスケールで実現する。
関連論文リスト
- SPARE: Single-Pass Annotation with Reference-Guided Evaluation for Automatic Process Supervision and Reward Modelling [58.05959902776133]
私たちはSingle-Passを紹介します。
Reference-Guided Evaluation (SPARE)は、効率的なステップごとのアノテーションを可能にする新しい構造化フレームワークである。
数学的推論(GSM8K, MATH)、マルチホップ質問応答(MuSiQue-Ans)、空間推論(SpaRP)にまたがる4つの多様なデータセットにおけるSPAREの有効性を実証する。
ProcessBenchでは、SPAREがデータ効率のよいアウト・オブ・ディストリビューションの一般化を実証し、トレーニングサンプルの$sim$16%しか使用していない。
論文 参考訳(メタデータ) (2025-06-18T14:37:59Z) - JanusDNA: A Powerful Bi-directional Hybrid DNA Foundation Model [1.6128508494592848]
大規模言語モデル(LLM)は自然言語処理に革命をもたらし、他のシーケンシャルなデータタイプにもますます適用されてきている。
我々は、新しい事前学習パラダイムに基づいて構築された、最初の双方向DNA基盤モデルであるJanusDNAを紹介する。
JanusDNAは、1つの80GB GPU上で1つのヌクレオチド分解能で100万塩基対を処理する。
論文 参考訳(メタデータ) (2025-05-22T20:10:55Z) - Reviving Any-Subset Autoregressive Models with Principled Parallel Sampling and Speculative Decoding [55.2480439325792]
任意の順序言語モデルでは、正しい関節分布からトークンを並列にサンプリングする方法がオープンな問題である。
我々は,任意のサブセット自動回帰モデル (AS-ARM) という,異なるモデルのクラスが解を持っていることを発見した。
我々は,AS-ARMがベンチマークタスクを埋め込んだ200M未満のパラメータモデル間で最先端の性能を実現し,コード生成における50倍のモデルの性能とほぼ一致していることを示す。
論文 参考訳(メタデータ) (2025-04-29T06:33:13Z) - Paraformer: Fast and Accurate Parallel Transformer for
Non-autoregressive End-to-End Speech Recognition [62.83832841523525]
そこで我々はParaformerと呼ばれる高速かつ高精度な並列トランスを提案する。
出力トークンの数を正確に予測し、隠れた変数を抽出する。
10倍以上のスピードアップで、最先端のARトランスフォーマーに匹敵するパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2022-06-16T17:24:14Z) - An EM Approach to Non-autoregressive Conditional Sequence Generation [49.11858479436565]
自己回帰(AR)モデルは条件付きシーケンス生成において支配的なアプローチである。
非自己回帰(NAR)モデルは、最近、すべての出力トークンを並列に生成することでレイテンシを低減するために提案されている。
本稿では,ARモデルとNARモデルの両方を統合期待最大化フレームワークで協調的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2020-06-29T20:58:57Z) - Imputer: Sequence Modelling via Imputation and Dynamic Programming [101.5705527605346]
Imputerは反復生成モデルであり、入力トークンや出力トークンの数に依存しない一定の数の生成ステップしか必要としない。
本稿では,ログ限界確率の低い動的プログラミング学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-20T18:21:30Z) - Stochastic geometry to generalize the Mondrian Process [0.0]
離散分布から引き出されたカット方向のSTITプロセスは,高次元軸方向のモンドリアン過程に昇降することにより効率的にシミュレーションできることを示す。
また、静止STITプロセスとそれらの混合物が近似できる全ての可能なカーネルを特徴付ける。
これにより、密度推定において、モンドリアンの森、モンドリアンのカーネル、ラプラスのカーネルの正確な比較が可能になる。
論文 参考訳(メタデータ) (2020-02-03T14:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。