論文の概要: Does DetectGPT Fully Utilize Perturbation? Selective Perturbation on
Model-Based Contrastive Learning Detector would be Better
- arxiv url: http://arxiv.org/abs/2402.00263v2
- Date: Sun, 4 Feb 2024 09:23:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 12:09:29.315613
- Title: Does DetectGPT Fully Utilize Perturbation? Selective Perturbation on
Model-Based Contrastive Learning Detector would be Better
- Title(参考訳): DetectGPTは摂動をフル活用しているか?
モデルベースコントラスト学習検出器の選択的摂動が良い
- Authors: Shengchao Liu, Xiaoming Liu, Yichen Wang, Zehua Cheng, Chengzhengxu
Li, Zhaohan Zhang, Yu Lan, Chao Shen
- Abstract要約: 本稿では,ランダムマスキングによる情報損失を軽減するために選択的戦略摂動を用いた新しい検出器Pecolaを提案する。
実験により、ペコラは4つの公開データセットで平均1.20%の精度でSOTA法より優れていることが示された。
- 参考スコア(独自算出の注目度): 22.844826522646336
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The burgeoning capabilities of large language models (LLMs) have raised
growing concerns about abuse. DetectGPT, a zero-shot metric-based unsupervised
machine-generated text detector, first introduces perturbation and shows great
performance improvement. However, DetectGPT's random perturbation strategy
might introduce noise, limiting the distinguishability and further performance
improvements. Moreover, its logit regression module relies on setting the
threshold, which harms the generalizability and applicability of individual or
small-batch inputs. Hence, we propose a novel detector, Pecola, which uses
selective strategy perturbation to relieve the information loss caused by
random masking, and multi-pair contrastive learning to capture the implicit
pattern information during perturbation, facilitating few-shot performance. The
experiments show that Pecola outperforms the SOTA method by 1.20% in accuracy
on average on four public datasets. We further analyze the effectiveness,
robustness, and generalization of our perturbation method.
- Abstract(参考訳): 大きな言語モデル(LLM)の急成長する能力は、乱用に対する懸念を高めている。
ゼロショットのメートル法に基づく教師なし機械生成テキスト検出器である DetectGPT は、まず摂動を導入し、優れた性能向上を示した。
しかし、T DetectGPTのランダムな摂動戦略はノイズを導入し、識別性やさらなる性能向上を抑える。
さらに、ロジット回帰モジュールは閾値の設定に依存しており、個別または小バッチ入力の一般化性と適用性に悪影響を及ぼす。
そこで我々は,ランダムマスキングによる情報損失を軽減するために選択的戦略摂動を用いた新しい検出器Pecolaと,摂動中に暗黙的なパターン情報をキャプチャするためのマルチペアコントラスト学習を提案する。
実験によれば、pecolaは4つの公開データセットで平均1.20%の精度でsoma法を上回っている。
さらに、摂動法の有効性、堅牢性、一般化について分析する。
関連論文リスト
- Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークの対象となっている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack [24.954755569786396]
そこで本研究では,機械生成コンテンツの小さな摂動を回避して検出を回避すべく,より広いレベルの敵攻撃のためのフレームワークを提案する。
我々は、ホワイトボックスとブラックボックスの2つの攻撃設定を検討し、現在の検出モデルのロバスト性を高める可能性を評価するために、動的シナリオにおける逆学習を採用する。
実験の結果、現在の検出モデルは10秒で妥協でき、機械が生成したテキストを人間の書き起こしコンテンツとして誤分類する結果となった。
論文 参考訳(メタデータ) (2024-04-02T12:49:22Z) - Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text
via Conditional Probability Curvature [36.31281981509264]
大規模言語モデル(LLM)は、流動的でコジェントなコンテンツを生成する能力を示している。
信頼できるAIシステムを構築するためには、マシン生成コンテンツと人間によるコンテンツとを区別することが不可欠である。
Fast-DetectGPTは、ディテクターGPTの摂動ステップを、より効率的なサンプリングステップで置き換える最適化されたゼロショット検出器である。
論文 参考訳(メタデータ) (2023-10-08T11:41:28Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Undersampling and Cumulative Class Re-decision Methods to Improve
Detection of Agitation in People with Dementia [16.949993123698345]
消化は認知症(PwD)で最も多い症状の1つである。
前回の研究では、参加者17名から600日間のマルチモーダルウェアラブルセンサデータを収集し、1分間の窓での動揺を検出する機械学習モデルを開発した。
本稿では,まず,不均衡を解消するために異なるアンダーサンプリング手法を実装し,通常の動作データの20%だけが競合的動揺検出モデルの訓練に適しているという結論に至った。
論文 参考訳(メタデータ) (2023-02-07T03:14:00Z) - DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability
Curvature [143.5381108333212]
大規模な言語モデルからサンプリングされたテキストは、モデルのログ確率関数の負の曲率領域を占有する傾向にあることを示す。
次に、与えられたLLMから通路が生成されるかどうかを判断するための新しい曲率ベースの基準を定義する。
我々は、モデルサンプル検出のための既存のゼロショット法よりもディテクターGPTの方が識別性が高いことを発見した。
論文 参考訳(メタデータ) (2023-01-26T18:44:06Z) - Adversarially Robust One-class Novelty Detection [83.1570537254877]
既存のノベルティ検出器は敵の例に感受性があることが示される。
本稿では, 新規性検知器の潜伏空間を制御し, 敵に対する堅牢性を向上する防衛戦略を提案する。
論文 参考訳(メタデータ) (2021-08-25T10:41:29Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。