論文の概要: A Girl Has A Name: Detecting Authorship Obfuscation
- arxiv url: http://arxiv.org/abs/2005.00702v1
- Date: Sat, 2 May 2020 04:52:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 12:08:05.933480
- Title: A Girl Has A Name: Detecting Authorship Obfuscation
- Title(参考訳): 少女の名前:著者の難読化を検知する
- Authors: Asad Mahmood, Zubair Shafiq and Padmini Srinivasan
- Abstract要約: 著者の属性は、テクストの分析に基づいてテキストの著者を特定することを目的としている。
著者の難読化は、テキストのスタイルを変更することによって著者の帰属を防ぐことを目的としている。
我々は、敵の脅威モデルの下で、最先端のオーサシップ難読化手法のステルス性を評価する。
- 参考スコア(独自算出の注目度): 12.461503242570643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Authorship attribution aims to identify the author of a text based on the
stylometric analysis. Authorship obfuscation, on the other hand, aims to
protect against authorship attribution by modifying a text's style. In this
paper, we evaluate the stealthiness of state-of-the-art authorship obfuscation
methods under an adversarial threat model. An obfuscator is stealthy to the
extent an adversary finds it challenging to detect whether or not a text
modified by the obfuscator is obfuscated - a decision that is key to the
adversary interested in authorship attribution. We show that the existing
authorship obfuscation methods are not stealthy as their obfuscated texts can
be identified with an average F1 score of 0.87. The reason for the lack of
stealthiness is that these obfuscators degrade text smoothness, as ascertained
by neural language models, in a detectable manner. Our results highlight the
need to develop stealthy authorship obfuscation methods that can better protect
the identity of an author seeking anonymity.
- Abstract(参考訳): authorship attributionは、スタイル分析に基づいてテキストの著者を特定することを目的としている。
一方、著者の難読化は、テキストのスタイルを変更することによって著者の帰属を防ぐことを目的としている。
本稿では,敵対的脅威モデルに基づく最先端のオーサシップ難読化手法のステルス性を評価する。
難読化者(obfuscator)は、難読化者によって修正されたテキストが難読化されているかどうかを検出するのが困難であると考える程度までステルスである。
既存の著者の難読化手法は、難読化テキストを平均F1スコア0.87で識別できるため、ステルス性がないことを示す。
ステルス性が欠如している理由は、これらの難読化器が、ニューラルネットワークモデルによって確認されるように、テキストの滑らかさを検出可能な方法で低下させるからだ。
本研究は,匿名性を求める著者の身元をよりよく保護するステルスな著作者の難読化手法の必要性を強調した。
関連論文リスト
- TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods [5.239989658197324]
著者の難読化は、著者の身元をテキスト内で偽装することを目的としている。
この変更は、プライバシーとユーティリティのバランスを取る必要がある。
政策最適化を用いたタスク指向オーサリング難読化(TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization)を提案する。
論文 参考訳(メタデータ) (2024-07-31T14:24:01Z) - Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文 参考訳(メタデータ) (2024-03-26T09:25:57Z) - Poisoned Forgery Face: Towards Backdoor Attacks on Face Forgery
Detection [62.595450266262645]
本稿では,バックドア攻撃による顔偽造検出の新たな脅威について紹介する。
バックドアをモデルに埋め込むことで、攻撃者は検知器を騙して偽造された顔の誤予測を発生させることができる。
我々は,顔偽造検知器に対するクリーンラベルバックドア攻撃を可能にするemphPoisoned Forgery Faceフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-18T06:31:05Z) - JAMDEC: Unsupervised Authorship Obfuscation using Constrained Decoding
over Small Language Models [53.83273575102087]
著者の難読化に対する教師なし推論時間アプローチを提案する。
本稿では,著者難読化のためのユーザ制御推論時間アルゴリズムであるJAMDECを紹介する。
提案手法は,GPT2-XL などの小型言語モデルに基づいて,オリジナルコンテンツをプロプライエタリな LLM の API に公開するのを防ぐ。
論文 参考訳(メタデータ) (2024-02-13T19:54:29Z) - UID as a Guiding Metric for Automated Authorship Obfuscation [0.0]
自動著者トリビュータは、著者のプールにテキストの著者を非常に正確に帰属させることができる。
これらの自動消火器の台頭に対応するため、自動消火器の台頭も行われている。
そこで我々は,一様情報密度(UID)理論として知られる心理学言語理論を利用した3つの新しい著者難読化手法を考案した。
論文 参考訳(メタデータ) (2023-11-05T22:16:37Z) - Can AI-Generated Text be Reliably Detected? [54.670136179857344]
LLMの規制されていない使用は、盗作、偽ニュースの生成、スパムなど、悪意のある結果をもたらす可能性がある。
最近の研究は、生成されたテキスト出力に存在する特定のモデルシグネチャを使用するか、透かし技術を適用してこの問題に対処しようとしている。
本稿では,これらの検出器は実用シナリオにおいて信頼性が低いことを示す。
論文 参考訳(メタデータ) (2023-03-17T17:53:19Z) - Zero-Query Transfer Attacks on Context-Aware Object Detectors [95.18656036716972]
敵は、ディープニューラルネットワークが誤った分類結果を生成するような摂動画像を攻撃する。
自然の多目的シーンに対する敵対的攻撃を防御するための有望なアプローチは、文脈整合性チェックを課すことである。
本稿では,コンテキスト整合性チェックを回避可能な,コンテキスト整合性攻撃を生成するための最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-29T04:33:06Z) - A Girl Has A Name, And It's ... Adversarial Authorship Attribution for
Deobfuscation [9.558392439655014]
本研究では,既存の難読化剤の有効性を低下させることが可能であることを示す。
以上の結果から,難治性の強い難治性アプローチの必要性が示唆された。
論文 参考訳(メタデータ) (2022-03-22T16:26:09Z) - Protecting Anonymous Speech: A Generative Adversarial Network
Methodology for Removing Stylistic Indicators in Text [2.9005223064604078]
我々は,生成的敵ネットワークの構築によるオーサリングの匿名化への新たなアプローチを開発する。
完全自動方式は,コンテンツ保存や流布の点で他の手法と同等の結果が得られる。
我々のアプローチは、オープンセットの文脈に順応し、これまで遭遇したことのない著者の文章を匿名化することができる。
論文 参考訳(メタデータ) (2021-10-18T17:45:56Z) - Avengers Ensemble! Improving Transferability of Authorship Obfuscation [7.962140902232626]
スティロメトリのアプローチは現実世界の著者の帰属に非常に効果的であることが示されている。
本稿では,トランスファー可能なオーサシップ難読化のためのアンサンブルに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-15T00:11:40Z) - InfoScrub: Towards Attribute Privacy by Targeted Obfuscation [77.49428268918703]
視覚データに流出した個人情報を個人が制限できる技術について検討する。
我々はこの問題を新しい画像難読化フレームワークで解決する。
提案手法では,元の入力画像に忠実な難読化画像を生成するとともに,非難読化画像に対して6.2$times$(または0.85bits)の不確実性を増大させる。
論文 参考訳(メタデータ) (2020-05-20T19:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。