論文の概要: Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text
via Conditional Probability Curvature
- arxiv url: http://arxiv.org/abs/2310.05130v2
- Date: Thu, 22 Feb 2024 08:31:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-23 18:28:59.340555
- Title: Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text
via Conditional Probability Curvature
- Title(参考訳): Fast-DetectGPT:条件付き確率曲線による機械生成テキストの効率的なゼロショット検出
- Authors: Guangsheng Bao, Yanbin Zhao, Zhiyang Teng, Linyi Yang, Yue Zhang
- Abstract要約: 大規模言語モデル(LLM)は、流動的でコジェントなコンテンツを生成する能力を示している。
信頼できるAIシステムを構築するためには、マシン生成コンテンツと人間によるコンテンツとを区別することが不可欠である。
Fast-DetectGPTは、ディテクターGPTの摂動ステップを、より効率的なサンプリングステップで置き換える最適化されたゼロショット検出器である。
- 参考スコア(独自算出の注目度): 36.31281981509264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have shown the ability to produce fluent and
cogent content, presenting both productivity opportunities and societal risks.
To build trustworthy AI systems, it is imperative to distinguish between
machine-generated and human-authored content. The leading zero-shot detector,
DetectGPT, showcases commendable performance but is marred by its intensive
computational costs. In this paper, we introduce the concept of conditional
probability curvature to elucidate discrepancies in word choices between LLMs
and humans within a given context. Utilizing this curvature as a foundational
metric, we present **Fast-DetectGPT**, an optimized zero-shot detector, which
substitutes DetectGPT's perturbation step with a more efficient sampling step.
Our evaluations on various datasets, source models, and test conditions
indicate that Fast-DetectGPT not only surpasses DetectGPT by a relative around
75% in both the white-box and black-box settings but also accelerates the
detection process by a factor of 340, as detailed in Table 1. See
\url{https://github.com/baoguangsheng/fast-detect-gpt} for code, data, and
results.
- Abstract(参考訳): 大規模言語モデル(LLM)は、流動的でコジェントなコンテンツを生み出す能力を示し、生産性の機会と社会的リスクの両方を提示している。
信頼できるAIシステムを構築するためには、マシン生成コンテンツと人間によるコンテンツとを区別することが不可欠である。
最上位のゼロショット検出器である DetectGPT は、高い性能を示すが、その計算コストに悩まされている。
本稿では,条件付き確率曲率の概念を導入し,与えられた文脈内でllmと人間の単語選択の相違を解明する。
この曲率を基本距離として、より効率的なサンプリングステップで検出GPTの摂動ステップを置き換える最適化ゼロショット検出器**Fast-DetectGPT*を提案する。
各種データセット, ソースモデル, テスト条件の評価から, Fast-DetectGPT は, ホワイトボックス設定とブラックボックス設定の両方で 75% の差で DetectGPT を上回るだけでなく, 340 倍の速度で検出プロセスを高速化することを示した。
コード、データ、結果については \url{https://github.com/baoguangsheng/fast-detect-gpt} を参照。
関連論文リスト
- A Two-Stage Dual-Path Framework for Text Tampering Detection and
Recognition [12.639006068141528]
深層学習の出現前は,文書改ざん検出は困難であった。
深層学習に基づくテキスト改ざん検出の分野でいくつかの探究を行った。
我々のPsタンパー検出法は,機能アシスト,監査点位置決め,タンパー認識の3段階を含む。
論文 参考訳(メタデータ) (2024-02-21T05:54:42Z) - Does DetectGPT Fully Utilize Perturbation? Bridge Selective Perturbation
to Fine-tuned Contrastive Learning Detector would be Better [22.844826522646336]
選択的摂動の対照的な学習により,新しい微調整検出器Pecolaを提案する。
実験の結果、ペコラは4つの公開データセットで平均して1.20%の精度で最先端であることがわかった。
論文 参考訳(メタデータ) (2024-02-01T01:23:07Z) - Token-Level Adversarial Prompt Detection Based on Perplexity Measures
and Contextual Information [67.78183175605761]
大規模言語モデルは、敵の迅速な攻撃に影響を受けやすい。
この脆弱性は、LLMの堅牢性と信頼性に関する重要な懸念を浮き彫りにしている。
トークンレベルで敵のプロンプトを検出するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-20T03:17:21Z) - Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。
既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。
本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文 参考訳(メタデータ) (2023-10-08T10:08:21Z) - On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。
GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文 参考訳(メタデータ) (2023-04-10T17:47:39Z) - DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability
Curvature [143.5381108333212]
大規模な言語モデルからサンプリングされたテキストは、モデルのログ確率関数の負の曲率領域を占有する傾向にあることを示す。
次に、与えられたLLMから通路が生成されるかどうかを判断するための新しい曲率ベースの基準を定義する。
我々は、モデルサンプル検出のための既存のゼロショット法よりもディテクターGPTの方が識別性が高いことを発見した。
論文 参考訳(メタデータ) (2023-01-26T18:44:06Z) - A Survey of Machine Learning Algorithms for Detecting Ransomware
Encryption Activity [0.0]
ランサムウェアを検出するために訓練された機械学習技術について調査する。
この研究は、Taylorらによる、センサーベースの方法による暗号化アクティビティの識別の取り組みに基づいている。
ランダムフォレストモデルでは、93%の精度と92%のF1のスコアが生成され、センサーによる検出が、コードが完全に実行される前にゼロデイランサムウェア攻撃を検知する実行可能な選択肢であることを示している。
論文 参考訳(メタデータ) (2021-10-14T18:02:31Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。