論文の概要: Does DetectGPT Fully Utilize Perturbation? Bridge Selective Perturbation
to Fine-tuned Contrastive Learning Detector would be Better
- arxiv url: http://arxiv.org/abs/2402.00263v3
- Date: Sat, 24 Feb 2024 13:46:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 21:42:17.188507
- Title: Does DetectGPT Fully Utilize Perturbation? Bridge Selective Perturbation
to Fine-tuned Contrastive Learning Detector would be Better
- Title(参考訳): DetectGPTは摂動をフル活用しているか?
微調整されたコントラスト学習検出器への橋梁選択摂動が良い
- Authors: Shengchao Liu, Xiaoming Liu, Yichen Wang, Zehua Cheng, Chengzhengxu
Li, Zhaohan Zhang, Yu Lan, Chao Shen
- Abstract要約: 選択的摂動の対照的な学習により,新しい微調整検出器Pecolaを提案する。
実験の結果、ペコラは4つの公開データセットで平均して1.20%の精度で最先端であることがわかった。
- 参考スコア(独自算出の注目度): 22.844826522646336
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The burgeoning generative capabilities of large language models (LLMs) have
raised growing concerns about abuse, demanding automatic machine-generated text
detectors. DetectGPT, a zero-shot metric-based detector, first introduces
perturbation and shows great performance improvement. However, in DetectGPT,
random perturbation strategy could introduce noise, and logit regression
depends on threshold, harming the generalizability and applicability of
individual or small-batch inputs. Hence, we propose a novel fine-tuned
detector, Pecola, bridging metric-based and fine-tuned detectors by contrastive
learning on selective perturbation. Selective strategy retains important tokens
during perturbation and weights for multi-pair contrastive learning. The
experiments show that Pecola outperforms the state-of-the-art by 1.20% in
accuracy on average on four public datasets. And we further analyze the
effectiveness, robustness, and generalization of the method.
- Abstract(参考訳): 大規模言語モデル(LLM)の急成長する生成能力は、不正行為に対する懸念を高め、自動機械生成テキスト検出器を要求している。
ゼロショットメートル法に基づく検出器である DetectGPT は、まず摂動を導入し、高い性能向上を示す。
しかし、T DetectGPTでは、ランダムな摂動戦略はノイズを発生させ、ロジット回帰は閾値に依存し、個別または小バッチ入力の一般化性と適用性を損なう。
そこで本研究では,選択的摂動に関するコントラスト学習により,新しい微調整検出器であるpecolaを提案する。
選択戦略は、マルチペアコントラスト学習のための摂動と重み付けにおいて重要なトークンを保持する。
実験の結果、ペコラは4つの公開データセットの平均で最先端の精度を1.20%上回ることがわかった。
さらに, 本手法の有効性, 堅牢性, 一般化について検討した。
関連論文リスト
- Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text
via Conditional Probability Curvature [36.31281981509264]
大規模言語モデル(LLM)は、流動的でコジェントなコンテンツを生成する能力を示している。
信頼できるAIシステムを構築するためには、マシン生成コンテンツと人間によるコンテンツとを区別することが不可欠である。
Fast-DetectGPTは、ディテクターGPTの摂動ステップを、より効率的なサンプリングステップで置き換える最適化されたゼロショット検出器である。
論文 参考訳(メタデータ) (2023-10-08T11:41:28Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Undersampling and Cumulative Class Re-decision Methods to Improve
Detection of Agitation in People with Dementia [16.949993123698345]
消化は認知症(PwD)で最も多い症状の1つである。
前回の研究では、参加者17名から600日間のマルチモーダルウェアラブルセンサデータを収集し、1分間の窓での動揺を検出する機械学習モデルを開発した。
本稿では,まず,不均衡を解消するために異なるアンダーサンプリング手法を実装し,通常の動作データの20%だけが競合的動揺検出モデルの訓練に適しているという結論に至った。
論文 参考訳(メタデータ) (2023-02-07T03:14:00Z) - DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability
Curvature [143.5381108333212]
大規模な言語モデルからサンプリングされたテキストは、モデルのログ確率関数の負の曲率領域を占有する傾向にあることを示す。
次に、与えられたLLMから通路が生成されるかどうかを判断するための新しい曲率ベースの基準を定義する。
我々は、モデルサンプル検出のための既存のゼロショット法よりもディテクターGPTの方が識別性が高いことを発見した。
論文 参考訳(メタデータ) (2023-01-26T18:44:06Z) - Learning to Detect with Constant False Alarm Rate [2.2559617939136505]
我々は、ターゲット検出に重点を置いた仮説テストにおける機械学習の利用を検討する。
我々は,任意のヌル仮説シナリオの下で,検出器の類似分布を促進する損失関数に項を加えることを提案する。
論文 参考訳(メタデータ) (2022-06-12T14:32:40Z) - Adversarially Robust One-class Novelty Detection [83.1570537254877]
既存のノベルティ検出器は敵の例に感受性があることが示される。
本稿では, 新規性検知器の潜伏空間を制御し, 敵に対する堅牢性を向上する防衛戦略を提案する。
論文 参考訳(メタデータ) (2021-08-25T10:41:29Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Locally optimal detection of stochastic targeted universal adversarial
perturbations [11.702958949553881]
局所最適一般化確率検定(LOGLRT)に基づく標的的普遍的逆乱(UAP)の検出法を導出する。
また,検出器のパラメータを学習するための教師付きトレーニング手法について述べるとともに,一般的な画像分類データセットの他の検出方法と比較して,検出器の性能が向上したことを示す。
論文 参考訳(メタデータ) (2020-12-08T19:27:39Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。