論文の概要: The Sensitivity of Word Embeddings-based Author Detection Models to
Semantic-preserving Adversarial Perturbations
- arxiv url: http://arxiv.org/abs/2102.11917v1
- Date: Tue, 23 Feb 2021 19:55:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-26 01:45:47.065468
- Title: The Sensitivity of Word Embeddings-based Author Detection Models to
Semantic-preserving Adversarial Perturbations
- Title(参考訳): 単語埋め込みに基づく著者検出モデルの意味的対向摂動に対する感度
- Authors: Jeremiah Duncan, Fabian Fallas, Chris Gropp, Emily Herron, Maria
Mahbub, Paula Olaya, Eduardo Ponce, Tabitha K. Samuel, Daniel Schultz,
Sudarshan Srinivasan, Maofeng Tang, Viktor Zenkov, Quan Zhou, Edmon Begoli
- Abstract要約: 著者分析は自然言語処理の分野において重要な課題である。
本稿では,入力の逆操作に対する既成アプローチの限界と感度について考察する。
- 参考スコア(独自算出の注目度): 3.7552532139404797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Authorship analysis is an important subject in the field of natural language
processing. It allows the detection of the most likely writer of articles,
news, books, or messages. This technique has multiple uses in tasks related to
authorship attribution, detection of plagiarism, style analysis, sources of
misinformation, etc. The focus of this paper is to explore the limitations and
sensitiveness of established approaches to adversarial manipulations of inputs.
To this end, and using those established techniques, we first developed an
experimental frame-work for author detection and input perturbations. Next, we
experimentally evaluated the performance of the authorship detection model to a
collection of semantic-preserving adversarial perturbations of input
narratives. Finally, we compare and analyze the effects of different
perturbation strategies, input and model configurations, and the effects of
these on the author detection model.
- Abstract(参考訳): 著者分析は自然言語処理の分野において重要な課題である。
それは記事、ニュース、本、またはメッセージの最も可能性の高い作家の検出を可能にします。
この技術は、著者の帰属、盗作の検出、スタイル分析、誤情報のソースなどに関連するタスクに複数の用途があります。
本論文では,入力の逆操作に対する既成アプローチの限界と感度について検討する。
そこで我々はまず,著者検出と入力摂動のための実験用フレームワークを開発した。
次に, 著者検出モデルの性能を, 入力ナラティブの意味保存的逆動の集合に実験的に評価した。
最後に, 異なる摂動戦略, 入力およびモデル構成, およびこれらが著者検出モデルに与える影響を比較し, 分析する。
関連論文リスト
- Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - Navigating the Shadows: Unveiling Effective Disturbances for Modern AI Content Detectors [24.954755569786396]
AIテキスト検出は、人間と機械が生成したコンテンツを区別するために現れた。
近年の研究では、これらの検出システムは、しばしば頑丈さを欠き、摂動テキストを効果的に区別する難しさを欠いていることが示されている。
我々の研究は、非公式な文章と専門的な文章の両方で現実世界のシナリオをシミュレートし、現在の検出器のアウト・オブ・ボックスのパフォーマンスを探求する。
論文 参考訳(メタデータ) (2024-06-13T08:37:01Z) - Who Writes the Review, Human or AI? [0.36498648388765503]
本研究では,AIによる書評と人間による書評を正確に区別する手法を提案する。
提案手法は移動学習を利用して,異なるトピック間で生成したテキストを識別する。
実験の結果、元のテキストのソースを検出でき、精度96.86%に達することが示されている。
論文 参考訳(メタデータ) (2024-05-30T17:38:44Z) - Leveraging the power of transformers for guilt detection in text [50.65526700061155]
本研究は,テキスト中の罪悪感を検出するための3つのトランスフォーマーベース言語モデルの適用性について検討する。
提案モデルでは,BERTとRoBERTaをそれぞれ2点,RoBERTaを1点で比較した。
論文 参考訳(メタデータ) (2024-01-15T01:40:39Z) - Assaying on the Robustness of Zero-Shot Machine-Generated Text Detectors [57.7003399760813]
先進的なLarge Language Models (LLMs) とその特殊な変種を探索し、いくつかの方法でこの分野に寄与する。
トピックと検出性能の間に有意な相関関係が発見された。
これらの調査は、様々なトピックにまたがるこれらの検出手法の適応性と堅牢性に光を当てた。
論文 参考訳(メタデータ) (2023-12-20T10:53:53Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - An Information-Theoretic Approach for Detecting Edits in AI-Generated Text [7.013432243663526]
本稿では,ある記事が生成言語モデルで完全に書かれたのか,あるいは異なる著者による編集を含むのか,あるいは人間なのかを判断する手法を提案する。
本手法の有効性を実データを用いた広範囲な評価により示す。
我々の分析は、情報理論とデータ科学の共通点における興味深い研究課題をいくつか提起する。
論文 参考訳(メタデータ) (2023-08-24T12:49:21Z) - Explainable Contextual Anomaly Detection using Quantile Regression
Forests [14.80211278818555]
本研究では,依存性に基づく従来の異常検出手法とコンテキスト異常検出手法の接続を開発する。
そこで本研究では,文脈異常検出を自然に解釈する手法を提案する。
本手法は, 精度と解釈可能性の観点から, 最先端の異常検出法より優れる。
論文 参考訳(メタデータ) (2023-02-22T09:39:59Z) - TraSE: Towards Tackling Authorial Style from a Cognitive Science
Perspective [4.123763595394021]
クロスドメインシナリオにおける27,000人以上の著者と1.4万のサンプルによるオーサリング属性実験の結果、90%のアトリビューション精度が得られた。
年齢などの身体的特徴を用いて、TraSE上で定性的な分析を行い、認知的特徴を捉えているという主張を検証する。
論文 参考訳(メタデータ) (2022-06-21T19:55:07Z) - Towards Unbiased Visual Emotion Recognition via Causal Intervention [63.74095927462]
本稿では,データセットバイアスによる負の効果を軽減するために,新しい感情認識ネットワーク(IERN)を提案する。
IERNの有効性を検証する一連の設計されたテストと、3つの感情ベンチマークの実験は、IERNが他の最先端のアプローチよりも優れていることを示した。
論文 参考訳(メタデータ) (2021-07-26T10:40:59Z) - On the Transferability of Adversarial Attacksagainst Neural Text
Classifier [121.6758865857686]
テキスト分類モデルの逆例の転送可能性について検討する。
本稿では,ほとんどすべての既存モデルを騙すために,敵の例を誘導できるモデル群を見つける遺伝的アルゴリズムを提案する。
これらの逆例からモデル診断に使用できる単語置換規則を導出する。
論文 参考訳(メタデータ) (2020-11-17T10:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。