Fugu-MT 論文翻訳(概要): The Sensitivity of Word Embeddings-based Author Detection Models to Semantic-preserving Adversarial Perturbations

論文の概要: The Sensitivity of Word Embeddings-based Author Detection Models to Semantic-preserving Adversarial Perturbations

arxiv url: http://arxiv.org/abs/2102.11917v1
Date: Tue, 23 Feb 2021 19:55:45 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-26 01:45:47.065468
Title: The Sensitivity of Word Embeddings-based Author Detection Models to Semantic-preserving Adversarial Perturbations
Title（参考訳）: 単語埋め込みに基づく著者検出モデルの意味的対向摂動に対する感度
Authors: Jeremiah Duncan, Fabian Fallas, Chris Gropp, Emily Herron, Maria Mahbub, Paula Olaya, Eduardo Ponce, Tabitha K. Samuel, Daniel Schultz, Sudarshan Srinivasan, Maofeng Tang, Viktor Zenkov, Quan Zhou, Edmon Begoli
Abstract要約: 著者分析は自然言語処理の分野において重要な課題である。本稿では,入力の逆操作に対する既成アプローチの限界と感度について考察する。
参考スコア（独自算出の注目度）: 3.7552532139404797
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Authorship analysis is an important subject in the field of natural language processing. It allows the detection of the most likely writer of articles, news, books, or messages. This technique has multiple uses in tasks related to authorship attribution, detection of plagiarism, style analysis, sources of misinformation, etc. The focus of this paper is to explore the limitations and sensitiveness of established approaches to adversarial manipulations of inputs. To this end, and using those established techniques, we first developed an experimental frame-work for author detection and input perturbations. Next, we experimentally evaluated the performance of the authorship detection model to a collection of semantic-preserving adversarial perturbations of input narratives. Finally, we compare and analyze the effects of different perturbation strategies, input and model configurations, and the effects of these on the author detection model.
Abstract（参考訳）: 著者分析は自然言語処理の分野において重要な課題である。それは記事、ニュース、本、またはメッセージの最も可能性の高い作家の検出を可能にします。この技術は、著者の帰属、盗作の検出、スタイル分析、誤情報のソースなどに関連するタスクに複数の用途があります。本論文では,入力の逆操作に対する既成アプローチの限界と感度について検討する。そこで我々はまず,著者検出と入力摂動のための実験用フレームワークを開発した。次に, 著者検出モデルの性能を, 入力ナラティブの意味保存的逆動の集合に実験的に評価した。最後に, 異なる摂動戦略, 入力およびモデル構成, およびこれらが著者検出モデルに与える影響を比較し, 分析する。

関連論文リスト

When Personalization Tricks Detectors: The Feature-Inversion Trap in Machine-Generated Text Detection [64.23509202768945]
パーソナライズされた設定における検出ロバスト性を評価するための最初のベンチマークであるデータセットを紹介する。実験により, 個別設定における検出器間の性能差が大きいことが示された。パーソナライズされた設定における検出性能変化を簡易かつ信頼性の高い予測方法を提案する。
論文参考訳（メタデータ） (2025-10-14T13:10:23Z)
Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。コード、事前トレーニングされたウェイト、デモがリリースされる。
論文参考訳（メタデータ） (2025-10-07T08:14:45Z)
Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文参考訳（メタデータ） (2024-10-08T17:59:03Z)
Navigating the Shadows: Unveiling Effective Disturbances for Modern AI Content Detectors [24.954755569786396]
AIテキスト検出は、人間と機械が生成したコンテンツを区別するために現れた。近年の研究では、これらの検出システムは、しばしば頑丈さを欠き、摂動テキストを効果的に区別する難しさを欠いていることが示されている。我々の研究は、非公式な文章と専門的な文章の両方で現実世界のシナリオをシミュレートし、現在の検出器のアウト・オブ・ボックスのパフォーマンスを探求する。
論文参考訳（メタデータ） (2024-06-13T08:37:01Z)
Who Writes the Review, Human or AI? [0.36498648388765503]
本研究では,AIによる書評と人間による書評を正確に区別する手法を提案する。提案手法は移動学習を利用して,異なるトピック間で生成したテキストを識別する。実験の結果、元のテキストのソースを検出でき、精度96.86%に達することが示されている。
論文参考訳（メタデータ） (2024-05-30T17:38:44Z)
Leveraging the power of transformers for guilt detection in text [50.65526700061155]
本研究は,テキスト中の罪悪感を検出するための3つのトランスフォーマーベース言語モデルの適用性について検討する。提案モデルでは,BERTとRoBERTaをそれぞれ2点,RoBERTaを1点で比較した。
論文参考訳（メタデータ） (2024-01-15T01:40:39Z)
Assaying on the Robustness of Zero-Shot Machine-Generated Text Detectors [57.7003399760813]
先進的なLarge Language Models (LLMs) とその特殊な変種を探索し、いくつかの方法でこの分野に寄与する。トピックと検出性能の間に有意な相関関係が発見された。これらの調査は、様々なトピックにまたがるこれらの検出手法の適応性と堅牢性に光を当てた。
論文参考訳（メタデータ） (2023-12-20T10:53:53Z)
How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文参考訳（メタデータ） (2023-11-14T08:51:00Z)
An Information-Theoretic Approach for Detecting Edits in AI-Generated Text [7.013432243663526]
本稿では,ある記事が生成言語モデルで完全に書かれたのか,あるいは異なる著者による編集を含むのか,あるいは人間なのかを判断する手法を提案する。本手法の有効性を実データを用いた広範囲な評価により示す。我々の分析は、情報理論とデータ科学の共通点における興味深い研究課題をいくつか提起する。
論文参考訳（メタデータ） (2023-08-24T12:49:21Z)
Explainable Contextual Anomaly Detection using Quantile Regression Forests [14.80211278818555]
本研究では,依存性に基づく従来の異常検出手法とコンテキスト異常検出手法の接続を開発する。そこで本研究では,文脈異常検出を自然に解釈する手法を提案する。本手法は, 精度と解釈可能性の観点から, 最先端の異常検出法より優れる。
論文参考訳（メタデータ） (2023-02-22T09:39:59Z)
TraSE: Towards Tackling Authorial Style from a Cognitive Science Perspective [4.123763595394021]
クロスドメインシナリオにおける27,000人以上の著者と1.4万のサンプルによるオーサリング属性実験の結果、90%のアトリビューション精度が得られた。年齢などの身体的特徴を用いて、TraSE上で定性的な分析を行い、認知的特徴を捉えているという主張を検証する。
論文参考訳（メタデータ） (2022-06-21T19:55:07Z)
Towards Unbiased Visual Emotion Recognition via Causal Intervention [63.74095927462]
本稿では,データセットバイアスによる負の効果を軽減するために,新しい感情認識ネットワーク(IERN)を提案する。 IERNの有効性を検証する一連の設計されたテストと、3つの感情ベンチマークの実験は、IERNが他の最先端のアプローチよりも優れていることを示した。
論文参考訳（メタデータ） (2021-07-26T10:40:59Z)
On the Transferability of Adversarial Attacksagainst Neural Text Classifier [121.6758865857686]
テキスト分類モデルの逆例の転送可能性について検討する。本稿では,ほとんどすべての既存モデルを騙すために,敵の例を誘導できるモデル群を見つける遺伝的アルゴリズムを提案する。これらの逆例からモデル診断に使用できる単語置換規則を導出する。
論文参考訳（メタデータ） (2020-11-17T10:45:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。