論文の概要: Reproduction and Replication of an Adversarial Stylometry Experiment
- arxiv url: http://arxiv.org/abs/2208.07395v1
- Date: Mon, 15 Aug 2022 18:24:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:17:01.350081
- Title: Reproduction and Replication of an Adversarial Stylometry Experiment
- Title(参考訳): 逆行性スティロメトリー実験の再現と複製
- Authors: Haining Wang, Patrick Juola, Allen Riddell
- Abstract要約: 本稿では,著者帰属に対する防衛に関する基礎的研究において,実験を再現し,再現する。
完全自動翻訳法であるラウンドトリップ翻訳が再検査に有用であることを示す新たな証拠が発見された。
- 参考スコア(独自算出の注目度): 8.374836126235499
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Maintaining anonymity while communicating using natural language remains a
challenge. Standard authorship attribution techniques that analyze candidate
authors' writing styles achieve uncomfortably high accuracy even when the
number of candidate authors is high. Adversarial stylometry defends against
authorship attribution with the goal of preventing unwanted deanonymization.
This paper reproduces and replicates experiments in a seminal study of defenses
against authorship attribution (Brennan et al., 2012). We are able to
successfully reproduce and replicate the original results, although we conclude
that the effectiveness of the defenses studied is overstated due to a lack of a
control group in the original study. In our replication, we find new evidence
suggesting that an entirely automatic method, round-trip translation, merits
re-examination as it appears to reduce the effectiveness of established
authorship attribution methods.
- Abstract(参考訳): 自然言語を使ってコミュニケーションしながら匿名性を維持することは課題である。
候補著者の執筆スタイルを分析する標準著作者属性技術は、候補著者数が高い場合でも不快なほど高い精度が得られる。
敵対的なスティロメトリは、望ましくない匿名化を防ぐために著者の帰属を擁護する。
本稿では,著者帰属に対する防衛に関する基礎的研究において,実験を再現し,再現する(Brennan et al., 2012)。
実験結果の再現と再現は可能であるが,本研究では制御群が欠如していることから,本研究の有効性が過大評価されている。
複製では,完全自動翻訳法であるラウンドトリップ翻訳法が,著者帰属法の有効性を低下させると考えられる再検討のメリットを示唆する新たな証拠が発見された。
関連論文リスト
- Beyond Black Box AI-Generated Plagiarism Detection: From Sentence to
Document Level [4.250876580245865]
既存のAI生成テキスト分類器は精度が限られており、しばしば偽陽性を生成する。
自然言語処理(NLP)技術を用いた新しい手法を提案する。
与えられた質問の複数のパラフレーズ付きバージョンを生成し、それを大きな言語モデルに入力し、回答を生成する。
本研究では,コサイン類似度に基づくコントラスト的損失関数を用いて,生成文と学生の反応とをマッチングする。
論文 参考訳(メタデータ) (2023-06-13T20:34:55Z) - Factually Consistent Summarization via Reinforcement Learning with
Textual Entailment Feedback [57.816210168909286]
我々は,この問題を抽象的な要約システムで解くために,テキストエンテーメントモデルの最近の進歩を活用している。
我々は、事実整合性を最適化するために、レファレンスフリーのテキストエンターメント報酬を用いた強化学習を用いる。
自動測定と人的評価の両結果から,提案手法は生成した要約の忠実さ,サリエンス,簡潔さを著しく向上させることが示された。
論文 参考訳(メタデータ) (2023-05-31T21:04:04Z) - Verifying the Robustness of Automatic Credibility Assessment [79.08422736721764]
テキスト分類法は信頼性の低い内容を検出する手段として広く研究されている。
入力テキストの無意味な変更は、モデルを誤解させることがある。
偽情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAを紹介する。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Learning with Rejection for Abstractive Text Summarization [42.15551472507393]
本稿では,拒絶学習に基づく抽象的な要約のための学習目標を提案する。
本手法は, 自動評価と人的評価において, 生成した要約の事実性を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-02-16T19:07:08Z) - Order-Disorder: Imitation Adversarial Attacks for Black-box Neural
Ranking Models [48.93128542994217]
ブラックボックスニューラルパスランキングモデルに対する模倣逆攻撃を提案する。
重要クエリ/候補を列挙することで,対象経路ランキングモデルを透明化し,模倣することができることを示す。
また,一対の目的関数によって強化された革新的な勾配に基づく攻撃手法を提案し,敵の引き金を発生させる。
論文 参考訳(メタデータ) (2022-09-14T09:10:07Z) - May the Force Be with Your Copy Mechanism: Enhanced Supervised-Copy
Method for Natural Language Generation [1.2453219864236247]
本稿では,どの単語をコピーする必要があるか,どの単語を生成する必要があるかをモデルが決定するのに役立つ,コピーネットワークの新しい教師付きアプローチを提案する。
具体的には、ソースシーケンスとターゲット語彙をコピーのガイダンスとして利用する目的関数を再定義する。
データ・テキスト・ジェネレーションと抽象的要約タスクの実験結果から,本手法が複写品質を高め,抽象性の程度を向上することを確認した。
論文 参考訳(メタデータ) (2021-12-20T06:54:28Z) - Protecting Anonymous Speech: A Generative Adversarial Network
Methodology for Removing Stylistic Indicators in Text [2.9005223064604078]
我々は,生成的敵ネットワークの構築によるオーサリングの匿名化への新たなアプローチを開発する。
完全自動方式は,コンテンツ保存や流布の点で他の手法と同等の結果が得られる。
我々のアプローチは、オープンセットの文脈に順応し、これまで遭遇したことのない著者の文章を匿名化することができる。
論文 参考訳(メタデータ) (2021-10-18T17:45:56Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - Adversarial Stylometry in the Wild: Transferable Lexical Substitution
Attacks on Author Profiling [13.722693312120462]
敵対的スタイメトグラフィーは、著者のテキストを書き換えることでそのようなモデルを攻撃しようとする。
本研究は、これらの敵対的攻撃を野生に展開するためのいくつかのコンポーネントを提案する。
論文 参考訳(メタデータ) (2021-01-27T10:42:44Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z) - Detecting Cross-Modal Inconsistency to Defend Against Neural Fake News [57.9843300852526]
我々は、画像やキャプションを含む機械生成ニュースに対して、より現実的で挑戦的な対策を導入する。
敵が悪用できる可能性のある弱点を特定するために、4つの異なる種類の生成された記事からなるNeuralNewsデータセットを作成します。
ユーザ実験から得られた貴重な知見に加えて,視覚的意味的不整合の検出にもとづく比較的効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-16T14:13:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。