Fugu-MT 論文翻訳(概要): Cloaked Classifiers: Pseudonymization Strategies on Sensitive Classification Tasks

論文の概要: Cloaked Classifiers: Pseudonymization Strategies on Sensitive Classification Tasks

arxiv url: http://arxiv.org/abs/2406.17875v1
Date: Tue, 25 Jun 2024 18:30:25 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-27 15:37:10.244362
Title: Cloaked Classifiers: Pseudonymization Strategies on Sensitive Classification Tasks
Title（参考訳）: 閉鎖型分類器:感性分類課題における擬似化戦略
Authors: Arij Riabi, Menel Mahamdi, Virginie Mouilleron, Djamé Seddah,
Abstract要約: 本稿では,データ保護と堅牢なプライバシ保護のバランスについて検討する。我々は,多言語急進化データセットを手動で偽名化する手法を共有し,元のデータに匹敵する性能を確保する。
参考スコア（独自算出の注目度）: 4.66054169739129
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Protecting privacy is essential when sharing data, particularly in the case of an online radicalization dataset that may contain personal information. In this paper, we explore the balance between preserving data usefulness and ensuring robust privacy safeguards, since regulations like the European GDPR shape how personal information must be handled. We share our method for manually pseudonymizing a multilingual radicalization dataset, ensuring performance comparable to the original data. Furthermore, we highlight the importance of establishing comprehensive guidelines for processing sensitive NLP data by sharing our complete pseudonymization process, our guidelines, the challenges we encountered as well as the resulting dataset.
Abstract（参考訳）: プライバシー保護は、特に個人情報を含むオンラインの過激化データセットの場合、データの共有には不可欠である。本稿では、欧州GDPRなどの規制が個人情報をどのように扱うべきかを形作るため、データの有用性と堅牢なプライバシー保護のバランスについて検討する。我々は,多言語急進化データセットを手動で偽名化する手法を共有し,元のデータに匹敵する性能を確保する。さらに、我々の完全偽名化プロセス、ガイドライン、遭遇した課題と得られたデータセットを共有することで、機密性の高いNLPデータを処理するための包括的なガイドラインを確立することの重要性を強調した。

関連論文リスト

Improving Noise Efficiency in Privacy-preserving Dataset Distillation [59.57846442477106]
本稿では,最適化からサンプリングを分離してコンバージェンスを向上し,信号品質を向上させる新しいフレームワークを提案する。 CIFAR-10では,従来の最先端手法の蒸留セットサイズを5分の1に減らして,クラス毎50イメージでtextbf10.0%,クラス毎50イメージで textbf8.3%向上した。
論文参考訳（メタデータ） (2025-08-03T13:15:52Z)
Human-Centered Interactive Anonymization for Privacy-Preserving Machine Learning: A Case for Human-Guided k-Anonymity [0.0]
我々は、k-匿名化プロセスに人間の入力を組み込むインタラクティブなアプローチを提案する。 UCIアダルトデータセットを用いて、対話型人間影響匿名化の分類結果と従来の完全自動化手法との比較を行った。この結果から,タスクや設定によって異なるが,人間の入力によってデータの有用性が向上する可能性が示唆された。
論文参考訳（メタデータ） (2025-07-05T17:20:18Z)
Aim High, Stay Private: Differentially Private Synthetic Data Enables Public Release of Behavioral Health Information with High Utility [2.1715431485081593]
差別化プライバシ(DP)は、再識別リスクに対する正式な保証を提供する。我々は、リングスタディ(LEMURS)を用いて測定されたライブ体験の第1相のDP合成データを生成する。 LEMURSデータセットの実際の使用状況から情報を得たフレームワークを用いて,合成データの有用性を評価する。
論文参考訳（メタデータ） (2025-06-30T15:58:34Z)
A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage [77.83757117924995]
我々は、データリリース時の個人のプライバシーリスクを定量化するために、再識別攻撃を評価する新しいフレームワークを提案する。本手法は, 衛生データから年齢や物質使用履歴などのセンシティブな属性を推測するために, 一見無害な補助情報を利用できることを示す。
論文参考訳（メタデータ） (2025-04-28T01:16:27Z)
DP-CDA: An Algorithm for Enhanced Privacy Preservation in Dataset Synthesis Through Randomized Mixing [0.8739101659113155]
有効なデータパブリッシングアルゴリズムであるemphDP-CDAを導入する。提案アルゴリズムは、クラス固有の方法でデータをランダムに混合し、プライバシー保証を確保するために慎重に調整されたランダム性を誘導することにより、合成データセットを生成する。以上の結果から,DP-CDAを用いた合成データセットは,同一のプライバシー要件下であっても,従来のデータパブリッシングアルゴリズムで生成したデータセットよりも優れた実用性が得られることが示唆された。
論文参考訳（メタデータ） (2024-11-25T06:14:06Z)
Towards Split Learning-based Privacy-Preserving Record Linkage [49.1574468325115]
ユーザデータのプライバシが要求されるアプリケーションを容易にするために、Split Learningが導入されている。本稿では,プライバシ保護記録マッチングのための分割学習の可能性について検討する。
論文参考訳（メタデータ） (2024-09-02T09:17:05Z)
Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
テキストの匿名化は、プライバシーを維持しながら機密データを共有するために重要である。既存の技術は、大規模言語モデルの再識別攻撃能力の新たな課題に直面している。本稿では,3つのLCMベースコンポーネント – プライバシ評価器,ユーティリティ評価器,最適化コンポーネント – で構成されるフレームワークを提案する。
論文参考訳（メタデータ） (2024-07-16T14:28:56Z)
The Data Minimization Principle in Machine Learning [61.17813282782266]
データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。様々な国際データ保護規制によって支持されている。しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文参考訳（メタデータ） (2024-05-29T19:40:27Z)
EROS: Entity-Driven Controlled Policy Document Summarization [16.661448437719464]
制御された抽象要約を用いてポリシー文書の解釈可能性と可読性を向上させることを提案する。プライバシー関連エンティティラベルをマークしたポリシー文書要約データセットであるPD-Sumを開発した。提案モデルであるEROSは,スパン型エンティティ抽出モデルを用いて重要なエンティティを識別し,それらを用いて要約情報の内容を制御する。
論文参考訳（メタデータ） (2024-02-29T21:44:50Z)
A Summary of Privacy-Preserving Data Publishing in the Local Setting [0.6749750044497732]
統計開示制御は、機密情報を匿名化して暴露するリスクを最小限にすることを目的としている。マイクロデータの復号化に使用される現在のプライバシ保存技術について概説し、様々な開示シナリオに適したプライバシ対策を掘り下げ、情報損失と予測性能の指標を評価する。
論文参考訳（メタデータ） (2023-12-19T04:23:23Z)
$\alpha$-Mutual Information: A Tunable Privacy Measure for Privacy Protection in Data Sharing [4.475091558538915]
本稿では, 有基の$alpha$-Mutual Informationを調整可能なプライバシ尺度として採用する。我々は、プライバシ保護を提供するためにオリジナルのデータを操作するための一般的な歪みに基づくメカニズムを定式化する。
論文参考訳（メタデータ） (2023-10-27T16:26:14Z)
PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文参考訳（メタデータ） (2023-10-03T22:37:01Z)
Libertas: Privacy-Preserving Collective Computation for Decentralised Personal Data Stores [18.91869691495181]
モジュールアーキテクチャであるLibertasを導入し、MPCとSolidのようなPSDを統合する。我々は、全知的な視点から、個人ベースの、ユーザ中心の信頼とセキュリティへのパラダイムシフトを紹介します。
論文参考訳（メタデータ） (2023-09-28T12:07:40Z)
How Do Input Attributes Impact the Privacy Loss in Differential Privacy? [55.492422758737575]
DPニューラルネットワークにおけるオブジェクトごとの規範と個人のプライバシ損失との関係について検討する。プライバシ・ロス・インプット・サセプティビリティ(PLIS)と呼ばれる新しい指標を導入し、被験者のプライバシ・ロスを入力属性に適応させることを可能にした。
論文参考訳（メタデータ） (2022-11-18T11:39:03Z)
Differentially Private Language Models for Secure Data Sharing [19.918137395199224]
本稿では,生成言語モデルを個別に学習し,その結果を抽出する方法について述べる。自然言語のプロンプトと新しいプロンプトミスマッチの損失を用いることで、高度に正確で流動的なテキストデータセットを作成できる。我々は、我々の合成データセットが元のデータから情報を漏らさず、言語質が高いことを示す徹底的な実験を行う。
論文参考訳（メタデータ） (2022-10-25T11:12:56Z)
Distributed Machine Learning and the Semblance of Trust [66.1227776348216]
フェデレートラーニング(FL)により、データ所有者はデータを共有することなく、データガバナンスを維持し、モデルトレーニングをローカルで行うことができる。 FLと関連する技術は、しばしばプライバシー保護と表現される。この用語が適切でない理由を説明し、プライバシの形式的定義を念頭に設計されていないプロトコルに対する過度な信頼に関連するリスクを概説する。
論文参考訳（メタデータ） (2021-12-21T08:44:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。