論文の概要: Reproduction and Replication of an Adversarial Stylometry Experiment
- arxiv url: http://arxiv.org/abs/2208.07395v1
- Date: Mon, 15 Aug 2022 18:24:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:17:01.350081
- Title: Reproduction and Replication of an Adversarial Stylometry Experiment
- Title(参考訳): 逆行性スティロメトリー実験の再現と複製
- Authors: Haining Wang, Patrick Juola, Allen Riddell
- Abstract要約: 本稿では,著者帰属に対する防衛に関する基礎的研究において,実験を再現し,再現する。
完全自動翻訳法であるラウンドトリップ翻訳が再検査に有用であることを示す新たな証拠が発見された。
- 参考スコア(独自算出の注目度): 8.374836126235499
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Maintaining anonymity while communicating using natural language remains a
challenge. Standard authorship attribution techniques that analyze candidate
authors' writing styles achieve uncomfortably high accuracy even when the
number of candidate authors is high. Adversarial stylometry defends against
authorship attribution with the goal of preventing unwanted deanonymization.
This paper reproduces and replicates experiments in a seminal study of defenses
against authorship attribution (Brennan et al., 2012). We are able to
successfully reproduce and replicate the original results, although we conclude
that the effectiveness of the defenses studied is overstated due to a lack of a
control group in the original study. In our replication, we find new evidence
suggesting that an entirely automatic method, round-trip translation, merits
re-examination as it appears to reduce the effectiveness of established
authorship attribution methods.
- Abstract(参考訳): 自然言語を使ってコミュニケーションしながら匿名性を維持することは課題である。
候補著者の執筆スタイルを分析する標準著作者属性技術は、候補著者数が高い場合でも不快なほど高い精度が得られる。
敵対的なスティロメトリは、望ましくない匿名化を防ぐために著者の帰属を擁護する。
本稿では,著者帰属に対する防衛に関する基礎的研究において,実験を再現し,再現する(Brennan et al., 2012)。
実験結果の再現と再現は可能であるが,本研究では制御群が欠如していることから,本研究の有効性が過大評価されている。
複製では,完全自動翻訳法であるラウンドトリップ翻訳法が,著者帰属法の有効性を低下させると考えられる再検討のメリットを示唆する新たな証拠が発見された。
関連論文リスト
- CopyBench: Measuring Literal and Non-Literal Reproduction of Copyright-Protected Text in Language Model Generation [132.00910067533982]
LM世代におけるリテラルコピーと非リテラルコピーの両方を測定するために設計されたベンチマークであるCopyBenchを紹介する。
リテラル複写は比較的稀であるが、イベント複写と文字複写という2種類の非リテラル複写は、7Bパラメータのモデルでも発生する。
論文 参考訳(メタデータ) (2024-07-09T17:58:18Z) - Keep It Private: Unsupervised Privatization of Online Text [13.381890596224867]
音声,感覚,プライバシのバランスを保った書き直しを生成するために,強化学習を通じて大規模言語モデルを微調整する自動テキスト民営化フレームワークを導入する。
短命長テキストからなる68kの著者による大規模な英語Reddit投稿に対して,これを広範囲に評価した。
論文 参考訳(メタデータ) (2024-05-16T17:12:18Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、大規模言語モデルによる研究アイデア作成エージェントである。
科学文献に基づいて繰り返し精製しながら、問題、方法、実験設計を生成する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z) - BERT-Enhanced Retrieval Tool for Homework Plagiarism Detection System [0.0]
GPT-3.5をベースとして,32,927対のテキストプラギアリズム検出データセットを生成する,プラギアライズされたテキストデータ生成手法を提案する。
また,BERT を用いた Faiss に基づく盗作識別手法を提案する。
このモデルの性能は, 98.86%, 98.90%, 98.86%, 0.9888, 精度, 精度, リコール, F1スコアなど, 様々な指標において他のモデルよりも優れていた。
論文 参考訳(メタデータ) (2024-04-01T12:20:34Z) - Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.72682366640554]
著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文 参考訳(メタデータ) (2024-03-17T16:36:26Z) - Confidence-driven Sampling for Backdoor Attacks [49.72680157684523]
バックドア攻撃は、悪質なトリガをDNNモデルに過剰に挿入することを目的としており、テストシナリオ中に不正な制御を許可している。
既存の方法では防衛戦略に対する堅牢性が欠如しており、主に無作為な試薬を無作為に選別しながら、引き金の盗難を強化することに重点を置いている。
信頼性スコアの低いサンプルを選別し、これらの攻撃を識別・対処する上で、守備側の課題を著しく増大させる。
論文 参考訳(メタデータ) (2023-10-08T18:57:36Z) - Learning with Rejection for Abstractive Text Summarization [42.15551472507393]
本稿では,拒絶学習に基づく抽象的な要約のための学習目標を提案する。
本手法は, 自動評価と人的評価において, 生成した要約の事実性を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-02-16T19:07:08Z) - May the Force Be with Your Copy Mechanism: Enhanced Supervised-Copy
Method for Natural Language Generation [1.2453219864236247]
本稿では,どの単語をコピーする必要があるか,どの単語を生成する必要があるかをモデルが決定するのに役立つ,コピーネットワークの新しい教師付きアプローチを提案する。
具体的には、ソースシーケンスとターゲット語彙をコピーのガイダンスとして利用する目的関数を再定義する。
データ・テキスト・ジェネレーションと抽象的要約タスクの実験結果から,本手法が複写品質を高め,抽象性の程度を向上することを確認した。
論文 参考訳(メタデータ) (2021-12-20T06:54:28Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - Adversarial Stylometry in the Wild: Transferable Lexical Substitution
Attacks on Author Profiling [13.722693312120462]
敵対的スタイメトグラフィーは、著者のテキストを書き換えることでそのようなモデルを攻撃しようとする。
本研究は、これらの敵対的攻撃を野生に展開するためのいくつかのコンポーネントを提案する。
論文 参考訳(メタデータ) (2021-01-27T10:42:44Z) - Detecting Cross-Modal Inconsistency to Defend Against Neural Fake News [57.9843300852526]
我々は、画像やキャプションを含む機械生成ニュースに対して、より現実的で挑戦的な対策を導入する。
敵が悪用できる可能性のある弱点を特定するために、4つの異なる種類の生成された記事からなるNeuralNewsデータセットを作成します。
ユーザ実験から得られた貴重な知見に加えて,視覚的意味的不整合の検出にもとづく比較的効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-16T14:13:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。