論文の概要: Advancing Machine-Generated Text Detection from an Easy to Hard Supervision Perspective
- arxiv url: http://arxiv.org/abs/2511.00988v1
- Date: Sun, 02 Nov 2025 15:59:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.017013
- Title: Advancing Machine-Generated Text Detection from an Easy to Hard Supervision Perspective
- Title(参考訳): 簡易・ハード・スーパービジョンから見た機械生成テキストの検出
- Authors: Chenwang Wu, Yiu-ming Cheung, Bo Han, Defu Lian,
- Abstract要約: 既存の機械生成テキスト(MGT)検出手法は、ラベルを「黄金標準」として暗黙的に仮定する
このような不正確な条件下での信頼性の高い監視を実現するための,容易かつハードな強化フレームワークを提案する。
- 参考スコア(独自算出の注目度): 108.30620357325559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing machine-generated text (MGT) detection methods implicitly assume labels as the "golden standard". However, we reveal boundary ambiguity in MGT detection, implying that traditional training paradigms are inexact. Moreover, limitations of human cognition and the superintelligence of detectors make inexact learning widespread and inevitable. To this end, we propose an easy-to-hard enhancement framework to provide reliable supervision under such inexact conditions. Distinct from knowledge distillation, our framework employs an easy supervisor targeting relatively simple longer-text detection tasks (despite weaker capabilities), to enhance the more challenging target detector. Firstly, longer texts targeted by supervisors theoretically alleviate the impact of inexact labels, laying the foundation for reliable supervision. Secondly, by structurally incorporating the detector into the supervisor, we theoretically model the supervisor as a lower performance bound for the detector. Thus, optimizing the supervisor indirectly optimizes the detector, ultimately approximating the underlying "golden" labels. Extensive experiments across diverse practical scenarios, including cross-LLM, cross-domain, mixed text, and paraphrase attacks, demonstrate the framework's significant detection effectiveness. The code is available at: https://github.com/tmlr-group/Easy2Hard.
- Abstract(参考訳): 既存の機械生成テキスト(MGT)検出手法は、ラベルを「黄金標準」と暗黙的に仮定している。
しかし、MGT検出における境界の曖昧さは、従来の訓練パラダイムが不正確であることを示唆している。
さらに、人間の認知の限界と検出器の超知能は、不正確な学習を広く、避けられないものにしている。
そこで本稿では,このような不正確な条件下での信頼性の高い監視を実現するための,使い易い強化フレームワークを提案する。
知識蒸留とは別として,本フレームワークでは,比較的単純な長文検出タスクを目標とした簡易なスーパーバイザを用いて,より困難な目標検出器を強化する。
第一に、監督官が対象とするより長いテキストは、不正確なラベルの影響を理論的に緩和し、信頼できる監督の基盤となる。
第2に,検出器をスーパーバイザに構造的に組み込むことにより,検出器の低性能バウンドとして理論的にスーパーバイザをモデル化する。
したがって、監督者の最適化は間接的に検出器を最適化し、最終的には下層の「黄金」ラベルを近似する。
クロスLLM、クロスドメイン、混合テキスト、パラフレーズ攻撃など、さまざまな実践シナリオにわたる大規模な実験は、フレームワークの重大な検出の有効性を実証している。
コードは、https://github.com/tmlr-group/Easy2Hard.comで入手できる。
関連論文リスト
- DetectAnyLLM: Towards Generalizable and Robust Detection of Machine-Generated Text Across Domains and Models [60.713908578319256]
タスク指向の知識で検出器を最適化するために,DDL(Direct Discrepancy Learning)を提案する。
そこで本研究では,最新のMGTD性能を実現する統合検出フレームワークであるTectAnyLLMを紹介する。
MIRAGEは5つのテキストドメインにまたがる10のコーパスから人書きテキストをサンプリングし、17個の最先端のLLMを使用して再生成または修正する。
論文 参考訳(メタデータ) (2025-09-15T10:59:57Z) - Stress-testing Machine Generated Text Detection: Shifting Language Models Writing Style to Fool Detectors [4.7713095161046555]
本稿では,最新のMGT検出器の言語情報による敵攻撃に対するレジリエンスをテストするパイプラインを提案する。
我々は、MGTスタイルを人文テキスト(HWT)にシフトするために、言語モデルを微調整する。
これは検出器が構造的な手がかりに頼っていることを悪用し、新しい世代を検知することがより困難になる。
論文 参考訳(メタデータ) (2025-05-30T12:33:30Z) - Detection Latencies of Anomaly Detectors: An Overlooked Perspective ? [1.8492669447784602]
本稿では,攻撃とエラーの時間的遅延を測定することの関連性について論じる。
本稿では,検知器の評価手法を提案する。
論文 参考訳(メタデータ) (2024-02-14T10:52:39Z) - Hard-normal Example-aware Template Mutual Matching for Industrial Anomaly Detection [78.734927709231]
異常検出器は、クエリー画像の未知の欠陥を検出し、ローカライズするために工業製造で広く使われている。
これらの検出器は異常のないサンプルで訓練され、ほとんどの通常のサンプルと区別された異常を成功させた。
しかし、ハードノーマルな例は、ほとんどの通常のサンプルから遠く離れており、しばしば既存の方法によって異常と誤認される。
論文 参考訳(メタデータ) (2023-03-28T17:54:56Z) - MGTBench: Benchmarking Machine-Generated Text Detection [54.81446366272403]
本稿では,強力な大規模言語モデル(LLM)に対するMGT検出のための最初のベンチマークフレームワークを提案する。
一般に単語が多ければ多いほど性能が向上し,ほとんどの検出手法はトレーニングサンプルをはるかに少なくして同様の性能が得られることを示す。
本研究は, テキスト属性タスクにおいて, モデルに基づく検出手法が依然として有効であることを示す。
論文 参考訳(メタデータ) (2023-03-26T21:12:36Z) - LEDetection: A Simple Framework for Semi-Supervised Few-Shot Object
Detection [4.3512163406552]
本稿では,ベースラベルと新規ラベルが同時に不足する現実的なシナリオを考慮し,半教師付きFSODの新たな課題について考察する。
我々は、疑似ラベルと地域提案の一貫性学習を組み合わせた堅牢な検出器であるSoftER Teacherを紹介する。
厳密な実験により、SoftER Teacherは必要なベースラベルの10%しか使用せず、強力な教師付き検出器の新規性能を上回ることが示されている。
論文 参考訳(メタデータ) (2023-03-10T06:49:31Z) - DetectorGuard: Provably Securing Object Detectors against Localized
Patch Hiding Attacks [28.94435153159868]
最先端のオブジェクト検出器は、局所的なパッチ隠蔽攻撃に対して脆弱である。
我々は,デザイナガードと呼ばれる局所的なパッチ隠蔽攻撃に対して,確実に堅牢な検出器を構築するための,最初の汎用フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-05T02:02:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。