Fugu-MT 論文翻訳(概要): Does \textsc{DetectGPT} Fully Utilize Perturbation? Selective Perturbation on Model-Based Contrastive Learning Detector would be Better

論文の概要: Does \textsc{DetectGPT} Fully Utilize Perturbation? Selective Perturbation on Model-Based Contrastive Learning Detector would be Better

arxiv url: http://arxiv.org/abs/2402.00263v1
Date: Thu, 1 Feb 2024 01:23:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-02 17:03:31.156579
Title: Does \textsc{DetectGPT} Fully Utilize Perturbation? Selective Perturbation on Model-Based Contrastive Learning Detector would be Better
Title（参考訳）: \textsc{DetectGPT} は摂動をフル活用するか? モデルベースコントラスト学習検出器の選択的摂動が良い
Authors: Shengchao Liu, Xiaoming Liu, Yichen Wang, Zehua Cheng, Chengzhengxu Li, Zhaohan Zhang, Yu Lan, Chao Shen
Abstract要約: 本稿では,ランダムマスキングによる重要な情報損失を軽減するために,選択的戦略摂動を用いた新しい検出器,モデル名を提案する。実験により、モデル名は4つの公開データセットで平均1.20%の精度でSOTA法より優れていることが示された。
参考スコア（独自算出の注目度）: 22.844826522646336
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The burgeoning capabilities of large language models (LLMs) have raised growing concerns about abuse. DetectGPT, a zero-shot metric-based unsupervised machine-generated text detector, first introduces perturbation and shows great performance improvement. However, DetectGPT's random perturbation strategy might introduce noise, limiting the distinguishability and further performance improvements. Moreover, its logit regression module relies on setting the threshold, which harms the generalizability and applicability of individual or small-batch inputs. Hence, we propose a novel detector, \modelname{}, which uses selective strategy perturbation to relieve the important information loss caused by random masking, and multi-pair contrastive learning to capture the implicit pattern information during perturbation, facilitating few-shot performance. The experiments show that \modelname{} outperforms the SOTA method by 1.20\% in accuracy on average on four public datasets. We further analyze the effectiveness, robustness, and generalization of our perturbation method.
Abstract（参考訳）: 大きな言語モデル(LLM)の急成長する能力は、乱用に対する懸念を高めている。ゼロショットのメートル法に基づく教師なし機械生成テキスト検出器である DetectGPT は、まず摂動を導入し、優れた性能向上を示した。しかし、T DetectGPTのランダムな摂動戦略はノイズを導入し、識別性やさらなる性能向上を抑える。さらに、ロジット回帰モジュールは閾値の設定に依存しており、個別または小バッチ入力の一般化性と適用性に悪影響を及ぼす。そこで本研究では,ランダムマスキングによる重要な情報損失を軽減するための選択的戦略摂動法と,摂動中に暗黙のパターン情報をキャプチャするマルチペアコントラスト学習を用いた新しい検出器である \modelname{} を提案する。実験の結果, モデルname{} は4つの公開データセットの平均精度において SOTA 法より 1.20 % 優れていた。さらに、摂動法の有効性、堅牢性、一般化について分析する。

関連論文リスト

Beyond Raw Detection Scores: Markov-Informed Calibration for Boosting Machine-Generated Text Detection [105.14032334647932]
機械生成テキスト(MGT)は偽情報やフィッシングなどのリスクを生じさせ、信頼性の高い検出の必要性を強調している。 MGTの統計的に区別可能な特徴を抽出するメトリックベース法は、オーバーフィットしがちな複雑なモデルベース法よりも実用的であることが多い。本稿では,2つのコンテキスト検出スコアの関係をモデル化したマルコフ情報を用いたスコアキャリブレーション手法を提案する。
論文参考訳（メタデータ） (2026-02-08T16:06:12Z)
Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。私たちのアプローチの中心は、強化学習と因果推論を統合することです。提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文参考訳（メタデータ） (2025-11-10T12:45:52Z)
How Sampling Affects the Detectability of Machine-written texts: A Comprehensive Study [39.866323800060066]
大きな言語モデル(LLM)はますます一般的になってきており、人間による内容とは区別がつかないことが多い。最近の多くの検出器は精度がほぼ完璧であると報告しており、AUROCのスコアは99%を超えている。本研究では,サンプリングに基づく復号化が検出可能性に与える影響について検討する。
論文参考訳（メタデータ） (2025-10-15T15:36:45Z)
Adversarial Augmentation and Active Sampling for Robust Cyber Anomaly Detection [1.102914654802229]
Advanced Persistent Threats (APTs)は、そのステルスで長期にわたる性質のために、サイバーセキュリティにかなり挑戦している。従来の教師付き学習手法は、通常大量のラベル付きデータを必要とする。本稿では,自動エンコーダによる異常検出と能動的学習を組み合わせて,APT検出を反復的に向上する手法を提案する。
論文参考訳（メタデータ） (2025-09-05T10:47:49Z)
Robust Partial-Label Learning by Leveraging Class Activation Values [0.0]
例えば、人間のアノテータは同じインスタンスに競合するクラスラベルを割り当てる。本稿では、ニューラルネットワークのクラスアクティベーション値の大きさを利用して、不確かさを明確に表現する主観論理に基づく新しい手法を提案する。提案手法は,高騒音下での予測性能において,より堅牢な予測を行うことを示す。
論文参考訳（メタデータ） (2025-02-17T12:30:05Z)
A Practical Examination of AI-Generated Text Detectors for Large Language Models [25.919278893876193]
機械生成コンテンツ検出器は、様々な条件や言語モデルからそのようなテキストを識別する。本稿では、これらの主張を、これらの検出器がこれまで遭遇していなかった領域、データセット、モデルにおいて、いくつかの一般的な検出器を評価することによって、批判的に評価する。
論文参考訳（メタデータ） (2024-12-06T15:56:11Z)
EMPERROR: A Flexible Generative Perception Error Model for Probing Self-Driving Planners [27.813716878034374]
本稿では, EMPERRORを提案する。我々は、現在の検出器を以前の研究よりも忠実に模倣していることを示します。現実的な入力を生成し、プランナーの衝突率を最大85%向上させることができる。
論文参考訳（メタデータ） (2024-11-12T11:24:18Z)
Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文参考訳（メタデータ） (2024-08-23T01:53:36Z)
Sample-agnostic Adversarial Perturbation for Vision-Language Pre-training Models [7.350203999073509]
AIセキュリティに関する最近の研究は、画像やテキストの微妙で意図的に設計された摂動に対するビジョンランゲージ事前学習モデルの脆弱性を強調している。私たちの知る限りでは、どんな画像にも当てはまる普遍的でサンプルに依存しない摂動の生成を探索する、マルチモーダルな決定境界による最初の研究である。
論文参考訳（メタデータ） (2024-08-06T06:25:39Z)
Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。 1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文参考訳（メタデータ） (2024-01-15T03:33:39Z)
Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text via Conditional Probability Curvature [36.31281981509264]
大規模言語モデル(LLM)は、流動的でコジェントなコンテンツを生成する能力を示している。信頼できるAIシステムを構築するためには、マシン生成コンテンツと人間によるコンテンツとを区別することが不可欠である。 Fast-DetectGPTは、ディテクターGPTの摂動ステップを、より効率的なサンプリングステップで置き換える最適化されたゼロショット検出器である。
論文参考訳（メタデータ） (2023-10-08T11:41:28Z)
On the Universal Adversarial Perturbations for Efficient Data-free Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文参考訳（メタデータ） (2023-06-27T02:54:07Z)
MAPS: A Noise-Robust Progressive Learning Approach for Source-Free Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文参考訳（メタデータ） (2023-02-09T12:06:08Z)
Undersampling and Cumulative Class Re-decision Methods to Improve Detection of Agitation in People with Dementia [16.949993123698345]
消化は認知症(PwD)で最も多い症状の1つである。前回の研究では、参加者17名から600日間のマルチモーダルウェアラブルセンサデータを収集し、1分間の窓での動揺を検出する機械学習モデルを開発した。本稿では,まず,不均衡を解消するために異なるアンダーサンプリング手法を実装し,通常の動作データの20%だけが競合的動揺検出モデルの訓練に適しているという結論に至った。
論文参考訳（メタデータ） (2023-02-07T03:14:00Z)
Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文参考訳（メタデータ） (2021-03-23T19:45:26Z)
Deep Semi-supervised Knowledge Distillation for Overlapping Cervical Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文参考訳（メタデータ） (2020-07-21T13:27:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。