論文の概要: Protecting Anonymous Speech: A Generative Adversarial Network
Methodology for Removing Stylistic Indicators in Text
- arxiv url: http://arxiv.org/abs/2110.09495v1
- Date: Mon, 18 Oct 2021 17:45:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 15:28:21.332448
- Title: Protecting Anonymous Speech: A Generative Adversarial Network
Methodology for Removing Stylistic Indicators in Text
- Title(参考訳): アノニマススピーチを保護する:テキスト中のスタイリスティックインジケータを除去するための生成的adversarial network方法論
- Authors: Rishi Balakrishnan, Stephen Sloan and Anil Aswani
- Abstract要約: 我々は,生成的敵ネットワークの構築によるオーサリングの匿名化への新たなアプローチを開発する。
完全自動方式は,コンテンツ保存や流布の点で他の手法と同等の結果が得られる。
我々のアプローチは、オープンセットの文脈に順応し、これまで遭遇したことのない著者の文章を匿名化することができる。
- 参考スコア(独自算出の注目度): 2.9005223064604078
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With Internet users constantly leaving a trail of text, whether through
blogs, emails, or social media posts, the ability to write and protest
anonymously is being eroded because artificial intelligence, when given a
sample of previous work, can match text with its author out of hundreds of
possible candidates. Existing approaches to authorship anonymization, also
known as authorship obfuscation, often focus on protecting binary demographic
attributes rather than identity as a whole. Even those that do focus on
obfuscating identity require manual feedback, lose the coherence of the
original sentence, or only perform well given a limited subset of authors. In
this paper, we develop a new approach to authorship anonymization by
constructing a generative adversarial network that protects identity and
optimizes for three different losses corresponding to anonymity, fluency, and
content preservation. Our fully automatic method achieves comparable results to
other methods in terms of content preservation and fluency, but greatly
outperforms baselines in regards to anonymization. Moreover, our approach is
able to generalize well to an open-set context and anonymize sentences from
authors it has not encountered before.
- Abstract(参考訳): インターネットユーザーは、ブログ、メール、ソーシャルメディアの投稿など、常にテキストの痕跡を残しているため、匿名で書き、抗議する能力は、人工知能が以前の研究のサンプルを与えられた場合、数百の候補の中から著者とテキストを一致させることができるため、侵食されている。
著者名匿名化に対する既存のアプローチは、著者名難読化(authorship obfuscation)とも呼ばれる。
難読化のアイデンティティにフォーカスする人でさえ、手動によるフィードバックを必要とし、元の文の一貫性を失うか、限られた著者のサブセットだけをうまく実行する。
本稿では,アイデンティティを保護し,匿名性,流動性,コンテンツ保存に対応する3つの異なる損失を最適化する生成的敵ネットワークを構築することにより,著者の匿名化に新たなアプローチを提案する。
完全自動方式は, コンテンツ保存や流布において他の手法と同等の結果を得るが, 匿名化においてはベースラインよりも優れていた。
さらに,オープンセットの文脈にうまく一般化し,これまでに遭遇したことのない著者の文章を匿名化することができる。
関連論文リスト
- Large Language Models are Advanced Anonymizers [13.900633576526863]
敵の匿名化が、現在の業界レベルの匿名化を、その結果のユーティリティとプライバシの点で上回っていることを示す。
まず,敵対的LLM推論の面における匿名性を評価するための新しい設定を提案する。
論文 参考訳(メタデータ) (2024-02-21T14:44:00Z) - JAMDEC: Unsupervised Authorship Obfuscation using Constrained Decoding
over Small Language Models [53.83273575102087]
著者の難読化に対する教師なし推論時間アプローチを提案する。
本稿では,著者難読化のためのユーザ制御推論時間アルゴリズムであるJAMDECを紹介する。
提案手法は,GPT2-XL などの小型言語モデルに基づいて,オリジナルコンテンツをプロプライエタリな LLM の API に公開するのを防ぐ。
論文 参考訳(メタデータ) (2024-02-13T19:54:29Z) - Defending Against Authorship Identification Attacks [9.148691357200216]
著者の識別は、署名されていない文書の著者の同一性を推測するのに不安定に有効であることが証明されている。
この論文は、過去20年以上にわたるこの研究領域の進歩に関する総合的なレビューを提供する。
論文 参考訳(メタデータ) (2023-10-02T19:03:11Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - GANonymization: A GAN-based Face Anonymization Framework for Preserving
Emotional Expressions [43.017036538109274]
GANonymizationは、表情保存能力を持つ新しい顔匿名化フレームワークである。
提案手法は, 顔の高レベル表現をベースとして, GAN(Generative Adversarial Network)に基づく匿名化バージョンに合成する。
論文 参考訳(メタデータ) (2023-05-03T14:22:48Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - Unsupervised Text Deidentification [101.2219634341714]
個人識別情報を漏洩する単語を隠蔽する教師なしの識別手法を提案する。
K匿名性に基づくプライバシによって動機づけられた私たちは、最小の再識別ランクを保証するリアクションを生成します。
論文 参考訳(メタデータ) (2022-10-20T18:54:39Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - Towards Variable-Length Textual Adversarial Attacks [68.27995111870712]
データの離散性のため、自然言語処理タスクに対してテキストによる敵意攻撃を行うことは非自明である。
本稿では,可変長テキスト対比攻撃(VL-Attack)を提案する。
本手法は、iwslt14ドイツ語英訳で3,18$ bleuスコアを達成でき、ベースラインモデルより1.47$改善できる。
論文 参考訳(メタデータ) (2021-04-16T14:37:27Z) - No Intruder, no Validity: Evaluation Criteria for Privacy-Preserving
Text Anonymization [0.48733623015338234]
自動テキスト匿名化システムを開発する研究者や実践者は,その評価手法が,個人を再同定から保護するシステムの能力に本当に反映しているかどうかを慎重に評価すべきである。
本稿では,匿名化手法の技術的性能,匿名化による情報損失,不正文書の非匿名化能力を含む評価基準のセットを提案する。
論文 参考訳(メタデータ) (2021-03-16T18:18:29Z) - Towards Face Encryption by Generating Adversarial Identity Masks [53.82211571716117]
敵の識別マスクを生成するためのターゲットID保護反復法(TIP-IM)を提案する。
TIP-IMは、様々な最先端の顔認識モデルに対して95%以上の保護成功率を提供する。
論文 参考訳(メタデータ) (2020-03-15T12:45:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。