論文の概要: Protecting Anonymous Speech: A Generative Adversarial Network
Methodology for Removing Stylistic Indicators in Text
- arxiv url: http://arxiv.org/abs/2110.09495v1
- Date: Mon, 18 Oct 2021 17:45:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 15:28:21.332448
- Title: Protecting Anonymous Speech: A Generative Adversarial Network
Methodology for Removing Stylistic Indicators in Text
- Title(参考訳): アノニマススピーチを保護する:テキスト中のスタイリスティックインジケータを除去するための生成的adversarial network方法論
- Authors: Rishi Balakrishnan, Stephen Sloan and Anil Aswani
- Abstract要約: 我々は,生成的敵ネットワークの構築によるオーサリングの匿名化への新たなアプローチを開発する。
完全自動方式は,コンテンツ保存や流布の点で他の手法と同等の結果が得られる。
我々のアプローチは、オープンセットの文脈に順応し、これまで遭遇したことのない著者の文章を匿名化することができる。
- 参考スコア(独自算出の注目度): 2.9005223064604078
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With Internet users constantly leaving a trail of text, whether through
blogs, emails, or social media posts, the ability to write and protest
anonymously is being eroded because artificial intelligence, when given a
sample of previous work, can match text with its author out of hundreds of
possible candidates. Existing approaches to authorship anonymization, also
known as authorship obfuscation, often focus on protecting binary demographic
attributes rather than identity as a whole. Even those that do focus on
obfuscating identity require manual feedback, lose the coherence of the
original sentence, or only perform well given a limited subset of authors. In
this paper, we develop a new approach to authorship anonymization by
constructing a generative adversarial network that protects identity and
optimizes for three different losses corresponding to anonymity, fluency, and
content preservation. Our fully automatic method achieves comparable results to
other methods in terms of content preservation and fluency, but greatly
outperforms baselines in regards to anonymization. Moreover, our approach is
able to generalize well to an open-set context and anonymize sentences from
authors it has not encountered before.
- Abstract(参考訳): インターネットユーザーは、ブログ、メール、ソーシャルメディアの投稿など、常にテキストの痕跡を残しているため、匿名で書き、抗議する能力は、人工知能が以前の研究のサンプルを与えられた場合、数百の候補の中から著者とテキストを一致させることができるため、侵食されている。
著者名匿名化に対する既存のアプローチは、著者名難読化(authorship obfuscation)とも呼ばれる。
難読化のアイデンティティにフォーカスする人でさえ、手動によるフィードバックを必要とし、元の文の一貫性を失うか、限られた著者のサブセットだけをうまく実行する。
本稿では,アイデンティティを保護し,匿名性,流動性,コンテンツ保存に対応する3つの異なる損失を最適化する生成的敵ネットワークを構築することにより,著者の匿名化に新たなアプローチを提案する。
完全自動方式は, コンテンツ保存や流布において他の手法と同等の結果を得るが, 匿名化においてはベースラインよりも優れていた。
さらに,オープンセットの文脈にうまく一般化し,これまでに遭遇したことのない著者の文章を匿名化することができる。
関連論文リスト
- IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization [8.483679748399037]
IncogniTextは,テキストを匿名化して潜在的敵を誤認し,誤った属性値を予測する手法である。
実証評価の結果,私的属性の漏洩が90%以上減少した。
論文 参考訳(メタデータ) (2024-07-03T09:49:03Z) - Anonymization Prompt Learning for Facial Privacy-Preserving Text-to-Image Generation [56.46932751058042]
我々は、テキストから画像への拡散モデルのための学習可能なプロンプトプレフィックスをトレーニングし、匿名化された顔のアイデンティティを生成するよう強制する。
実験では,非同一性固有の画像生成の品質を損なうことなく,特定の個人を匿名化するAPLの匿名化性能を実証した。
論文 参考訳(メタデータ) (2024-05-27T07:38:26Z) - Keep It Private: Unsupervised Privatization of Online Text [13.381890596224867]
音声,感覚,プライバシのバランスを保った書き直しを生成するために,強化学習を通じて大規模言語モデルを微調整する自動テキスト民営化フレームワークを導入する。
短命長テキストからなる68kの著者による大規模な英語Reddit投稿に対して,これを広範囲に評価した。
論文 参考訳(メタデータ) (2024-05-16T17:12:18Z) - RedactBuster: Entity Type Recognition from Redacted Documents [13.172863061928899]
文コンテキストを用いた最初の匿名化モデルであるRedactBusterを提案し、反応テキスト上で名前付きエンティティ認識を行う。
我々はRedactBusterを最も効果的なリアクション技術に対してテストし、公開されているテキスト匿名化ベンチマーク(TAB)を用いて評価する。
その結果,文書の性質やエンティティタイプに関わらず,最大0.985の精度が得られた。
論文 参考訳(メタデータ) (2024-04-19T16:42:44Z) - JAMDEC: Unsupervised Authorship Obfuscation using Constrained Decoding
over Small Language Models [53.83273575102087]
著者の難読化に対する教師なし推論時間アプローチを提案する。
本稿では,著者難読化のためのユーザ制御推論時間アルゴリズムであるJAMDECを紹介する。
提案手法は,GPT2-XL などの小型言語モデルに基づいて,オリジナルコンテンツをプロプライエタリな LLM の API に公開するのを防ぐ。
論文 参考訳(メタデータ) (2024-02-13T19:54:29Z) - Defending Against Authorship Identification Attacks [9.148691357200216]
著者の識別は、署名されていない文書の著者の同一性を推測するのに不安定に有効であることが証明されている。
この論文は、過去20年以上にわたるこの研究領域の進歩に関する総合的なレビューを提供する。
論文 参考訳(メタデータ) (2023-10-02T19:03:11Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - Unsupervised Text Deidentification [101.2219634341714]
個人識別情報を漏洩する単語を隠蔽する教師なしの識別手法を提案する。
K匿名性に基づくプライバシによって動機づけられた私たちは、最小の再識別ランクを保証するリアクションを生成します。
論文 参考訳(メタデータ) (2022-10-20T18:54:39Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - No Intruder, no Validity: Evaluation Criteria for Privacy-Preserving
Text Anonymization [0.48733623015338234]
自動テキスト匿名化システムを開発する研究者や実践者は,その評価手法が,個人を再同定から保護するシステムの能力に本当に反映しているかどうかを慎重に評価すべきである。
本稿では,匿名化手法の技術的性能,匿名化による情報損失,不正文書の非匿名化能力を含む評価基準のセットを提案する。
論文 参考訳(メタデータ) (2021-03-16T18:18:29Z) - Towards Face Encryption by Generating Adversarial Identity Masks [53.82211571716117]
敵の識別マスクを生成するためのターゲットID保護反復法(TIP-IM)を提案する。
TIP-IMは、様々な最先端の顔認識モデルに対して95%以上の保護成功率を提供する。
論文 参考訳(メタデータ) (2020-03-15T12:45:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。