Fugu-MT 論文翻訳(概要): Complete Evasion, Zero Modification: PDF Attacks on AI Text Detection

論文の概要: Complete Evasion, Zero Modification: PDF Attacks on AI Text Detection

arxiv url: http://arxiv.org/abs/2508.01887v1
Date: Sun, 03 Aug 2025 18:43:41 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-05 18:25:22.107598
Title: Complete Evasion, Zero Modification: PDF Attacks on AI Text Detection
Title（参考訳）: AIテキスト検出におけるPDF攻撃
Authors: Aldan Creo,
Abstract要約: 我々は、PDF文書における視覚テキストレイアウトと抽出順序の相違を利用した新しい攻撃であるPDFuzzを提案する。我々は、人間とAIが生成するテキストのデータセットを用いて、ArguGPT検出器に対するこのアプローチを評価する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: AI-generated text detectors have become essential tools for maintaining content authenticity, yet their robustness against evasion attacks remains questionable. We present PDFuzz, a novel attack that exploits the discrepancy between visual text layout and extraction order in PDF documents. Our method preserves exact textual content while manipulating character positioning to scramble extraction sequences. We evaluate this approach against the ArguGPT detector using a dataset of human and AI-generated text. Our results demonstrate complete evasion: detector performance drops from (93.6 $\pm$ 1.4) % accuracy and 0.938 $\pm$ 0.014 F1 score to random-level performance ((50.4 $\pm$ 3.2) % accuracy, 0.0 F1 score) while maintaining perfect visual fidelity. Our work reveals a vulnerability in current detection systems that is inherent to PDF document structures and underscores the need for implementing sturdy safeguards against such attacks. We make our code publicly available at https://github.com/ACMCMC/PDFuzz.
Abstract（参考訳）: AIが生成したテキスト検出器は、コンテンツの信頼性を維持する上で不可欠なツールとなっているが、回避攻撃に対する堅牢性には疑問の余地がある。本稿では,PDF文書における視覚テキストレイアウトと抽出順序の相違を利用した新たな攻撃であるPDFuzzを提案する。本手法は,文字位置をスクランブル抽出シーケンスに操作しながら,正確なテキスト内容を保存する。我々は、人間とAIが生成するテキストのデータセットを用いて、ArguGPT検出器に対するこのアプローチを評価する。検出性能は(93.6 $\pm$ 1.4) %, 0.938 $\pm$ 0.014 F1 スコアからランダムレベルの性能((50.4 $\pm$ 3.2) %, 0.0 F1 スコア)まで低下する。我々の研究は、PDF文書構造に固有の現在の検知システムにおける脆弱性を明らかにし、そのような攻撃に対して頑丈な保護を実装する必要性を浮き彫りにしている。コードをhttps://github.com/ACMCMC/PDFuzz.comで公開しています。

関連論文リスト

StealthRL: Reinforcement Learning Paraphrase Attacks for Multi-Detector Evasion of AI-Text Detectors [0.0]
StealthRLはAIテキスト検出のための強化学習フレームワークである。我々は,現実的な対向条件下で,マルチ検出器アンサンブルに対してパラフレーズポリシーを訓練する。 StealthRLはゼロに近い検出を実現し、平均AUROCを0.74から0.27に減らし、99.9%の攻撃成功率を達成した。
論文参考訳（メタデータ） (2026-02-09T17:33:46Z)
Diversity Boosts AI-Generated Text Detection [51.56484100374058]
DivEyeは、予備的な機能を使って、予測不可能がテキスト間でどのように変動するかをキャプチャする、新しいフレームワークである。提案手法は、既存のゼロショット検出器を最大33.2%向上させ、微調整ベースラインとの競合性能を達成する。
論文参考訳（メタデータ） (2025-09-23T10:21:22Z)
Evaluating the Performance of AI Text Detectors, Few-Shot and Chain-of-Thought Prompting Using DeepSeek Generated Text [2.942616054218564]
標準および人為的パラフレージングのようなアドリバーサ攻撃は、検出者がテキストを検出する能力を阻害する。我々は、DeepSeekが生成したテキストを、一般的なAI Text、Content Detector AI、Copyleaks、QuillBot、GPT-2、GPTZeroの6つが一貫して認識できるかどうかを調査する。
論文参考訳（メタデータ） (2025-07-23T21:26:33Z)
$\texttt{Droid}$: A Resource Suite for AI-Generated Code Detection [75.6327970381944]
$textbf$textttDroidCollection$$は、機械生成コード検出器のトレーニングと評価のためのオープンデータスイートである。これには100万以上のコードサンプル、7つのプログラミング言語、43のコーディングモデルからの出力、3つの実世界のコーディングドメインが含まれている。また、$textttDroidCollection$$でマルチタスクでトレーニングされたエンコーダのみの検出器も開発しています。
論文参考訳（メタデータ） (2025-07-11T12:19:06Z)
Adversarial Paraphrasing: A Universal Attack for Humanizing AI-Generated Text [47.84655968112988]
本稿では、AI生成したテキストを普遍的に人間化し、検出をより効果的に回避する、トレーニング不要な攻撃フレームワークであるAdversarial Paraphrasingを紹介する。我々の攻撃は広範囲に効果があり、複数の検知システムにまたがって非常に伝達可能である。
論文参考訳（メタデータ） (2025-06-08T05:15:01Z)
AuthorMist: Evading AI Text Detectors with Reinforcement Learning [4.806579822134391]
AuthorMistは、AI生成したテキストを人間ライクな文章に変換する、新しい強化学習ベースのシステムだ。 AuthorMistは,本来の意味を保ちながら,AI生成テキストの検出性を効果的に低減することを示す。
論文参考訳（メタデータ） (2025-03-10T12:41:05Z)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [60.09665704993751]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文参考訳（メタデータ） (2025-02-06T21:58:48Z)
SilverSpeak: Evading AI-Generated Text Detectors using Homoglyphs [0.0]
ホモグリフベースの攻撃は、最先端のAI生成テキスト検出器を効果的に回避することができる。以上の結果から,ホモグリフによる攻撃が,最先端の検出器を効果的に回避できることが示唆された。
論文参考訳（メタデータ） (2024-06-17T06:07:32Z)
Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文参考訳（メタデータ） (2023-10-08T10:08:21Z)
An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文参考訳（メタデータ） (2023-07-30T13:43:27Z)
Paraphrasing evades detectors of AI-generated text, but retrieval is an effective defense [56.077252790310176]
本稿では,パラフレーズ生成モデル(DIPPER)を提案する。 DIPPERを使って3つの大きな言語モデル(GPT3.5-davinci-003)で生成されたテキストを言い換えると、透かしを含むいくつかの検出器を回避できた。我々は,言語モデルAPIプロバイダによって維持されなければならない,意味論的に類似した世代を検索するシンプルなディフェンスを導入する。
論文参考訳（メタデータ） (2023-03-23T16:29:27Z)
Can AI-Generated Text be Reliably Detected? [50.95804851595018]
大規模言語モデル(LLM)は、様々なアプリケーションで非常によく機能します。盗作、偽ニュースの発生、スパムなどの活動においてこれらのモデルが誤用される可能性があることは、彼らの責任ある使用に対する懸念を引き起こしている。我々は、攻撃者の存在下で、これらのAIテキスト検出装置の堅牢性を強調テストする。
論文参考訳（メタデータ） (2023-03-17T17:53:19Z)
Detection as Regression: Certified Object Detection by Median Smoothing [50.89591634725045]
この研究は、ランダム化平滑化による認定分類の最近の進歩によって動機付けられている。我々は、$ell$-bounded攻撃に対するオブジェクト検出のための、最初のモデル非依存、トレーニング不要、認定された防御条件を得る。
論文参考訳（メタデータ） (2020-07-07T18:40:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。