論文の概要: The Sensitivity of Word Embeddings-based Author Detection Models to
Semantic-preserving Adversarial Perturbations
- arxiv url: http://arxiv.org/abs/2102.11917v1
- Date: Tue, 23 Feb 2021 19:55:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-26 01:45:47.065468
- Title: The Sensitivity of Word Embeddings-based Author Detection Models to
Semantic-preserving Adversarial Perturbations
- Title(参考訳): 単語埋め込みに基づく著者検出モデルの意味的対向摂動に対する感度
- Authors: Jeremiah Duncan, Fabian Fallas, Chris Gropp, Emily Herron, Maria
Mahbub, Paula Olaya, Eduardo Ponce, Tabitha K. Samuel, Daniel Schultz,
Sudarshan Srinivasan, Maofeng Tang, Viktor Zenkov, Quan Zhou, Edmon Begoli
- Abstract要約: 著者分析は自然言語処理の分野において重要な課題である。
本稿では,入力の逆操作に対する既成アプローチの限界と感度について考察する。
- 参考スコア(独自算出の注目度): 3.7552532139404797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Authorship analysis is an important subject in the field of natural language
processing. It allows the detection of the most likely writer of articles,
news, books, or messages. This technique has multiple uses in tasks related to
authorship attribution, detection of plagiarism, style analysis, sources of
misinformation, etc. The focus of this paper is to explore the limitations and
sensitiveness of established approaches to adversarial manipulations of inputs.
To this end, and using those established techniques, we first developed an
experimental frame-work for author detection and input perturbations. Next, we
experimentally evaluated the performance of the authorship detection model to a
collection of semantic-preserving adversarial perturbations of input
narratives. Finally, we compare and analyze the effects of different
perturbation strategies, input and model configurations, and the effects of
these on the author detection model.
- Abstract(参考訳): 著者分析は自然言語処理の分野において重要な課題である。
それは記事、ニュース、本、またはメッセージの最も可能性の高い作家の検出を可能にします。
この技術は、著者の帰属、盗作の検出、スタイル分析、誤情報のソースなどに関連するタスクに複数の用途があります。
本論文では,入力の逆操作に対する既成アプローチの限界と感度について検討する。
そこで我々はまず,著者検出と入力摂動のための実験用フレームワークを開発した。
次に, 著者検出モデルの性能を, 入力ナラティブの意味保存的逆動の集合に実験的に評価した。
最後に, 異なる摂動戦略, 入力およびモデル構成, およびこれらが著者検出モデルに与える影響を比較し, 分析する。
関連論文リスト
- Leveraging the power of transformers for guilt detection in text [50.65526700061155]
本研究は,テキスト中の罪悪感を検出するための3つのトランスフォーマーベース言語モデルの適用性について検討する。
提案モデルでは,BERTとRoBERTaをそれぞれ2点,RoBERTaを1点で比較した。
論文 参考訳(メタデータ) (2024-01-15T01:40:39Z) - Assaying on the Robustness of Zero-Shot Machine-Generated Text Detectors [57.7003399760813]
先進的なLarge Language Models (LLMs) とその特殊な変種を探索し、いくつかの方法でこの分野に寄与する。
トピックと検出性能の間に有意な相関関係が発見された。
これらの調査は、様々なトピックにまたがるこれらの検出手法の適応性と堅牢性に光を当てた。
論文 参考訳(メタデータ) (2023-12-20T10:53:53Z) - Artificial Text Boundary Detection with Topological Data Analysis and
Sliding Window Techniques [7.268650032347209]
我々は,この人工テキスト境界検出問題に対して,様々なアプローチを検討・比較する。
本稿では,RoBERTaモデルの教師付き微調整が,一般に有効であることを示す。
本研究では,凍結言語モデルの埋め込みから抽出した特徴に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-14T17:48:19Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - Separating the Human Touch from AI-Generated Text using Higher
Criticism: An Information-Theoretic Approach [8.285441115330944]
方法は、対数パープレクティリティとクロスエントロピー率の収束によって動機付けられる。
実データを用いて本手法の有効性を実証し,その成功に影響を及ぼす要因を分析した。
論文 参考訳(メタデータ) (2023-08-24T12:49:21Z) - Explainable Contextual Anomaly Detection using Quantile Regression
Forests [14.80211278818555]
本研究では,依存性に基づく従来の異常検出手法とコンテキスト異常検出手法の接続を開発する。
そこで本研究では,文脈異常検出を自然に解釈する手法を提案する。
本手法は, 精度と解釈可能性の観点から, 最先端の異常検出法より優れる。
論文 参考訳(メタデータ) (2023-02-22T09:39:59Z) - The Invariant Ground Truth of Affect [2.570570340104555]
感情の基底的真理は、感情の主観的な性質とそのラベルに固有のバイアスを意図せずに含んでいる影響ラベルに起因している。
本稿では、因果関係論の側面を感情計算に伝達することにより、影響の信頼性の高い基礎的真理を得る方法について再検討する。
我々は、情緒的コーパスにおけるアウトリーチの検出と、参加者やタスク間で堅牢な影響モデルの構築に、因果関係にインスパイアされた手法を採用している。
論文 参考訳(メタデータ) (2022-10-14T08:26:01Z) - TraSE: Towards Tackling Authorial Style from a Cognitive Science
Perspective [4.123763595394021]
クロスドメインシナリオにおける27,000人以上の著者と1.4万のサンプルによるオーサリング属性実験の結果、90%のアトリビューション精度が得られた。
年齢などの身体的特徴を用いて、TraSE上で定性的な分析を行い、認知的特徴を捉えているという主張を検証する。
論文 参考訳(メタデータ) (2022-06-21T19:55:07Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Towards Unbiased Visual Emotion Recognition via Causal Intervention [63.74095927462]
本稿では,データセットバイアスによる負の効果を軽減するために,新しい感情認識ネットワーク(IERN)を提案する。
IERNの有効性を検証する一連の設計されたテストと、3つの感情ベンチマークの実験は、IERNが他の最先端のアプローチよりも優れていることを示した。
論文 参考訳(メタデータ) (2021-07-26T10:40:59Z) - On the Transferability of Adversarial Attacksagainst Neural Text
Classifier [121.6758865857686]
テキスト分類モデルの逆例の転送可能性について検討する。
本稿では,ほとんどすべての既存モデルを騙すために,敵の例を誘導できるモデル群を見つける遺伝的アルゴリズムを提案する。
これらの逆例からモデル診断に使用できる単語置換規則を導出する。
論文 参考訳(メタデータ) (2020-11-17T10:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。