論文の概要: Hitting a Moving Target: Test-Time Adaptation for AI Text Detection under Continual Distribution Shift
- arxiv url: http://arxiv.org/abs/2606.25152v1
- Date: Tue, 23 Jun 2026 20:37:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.139794
- Title: Hitting a Moving Target: Test-Time Adaptation for AI Text Detection under Continual Distribution Shift
- Title(参考訳): 移動目標の隠れ:連続分布シフトによるAIテキスト検出のためのテスト時間適応
- Authors: Kevin Ren, Manish Raghavan, Nikhil Garg,
- Abstract要約: AIテキスト検出のためのデプロイされたアプローチは、人書きテキストとAI生成テキストの両方のラベル付きデータセットへのトレーニング時間アクセスに依存することが多い。
本研究では,半教師付き学習を用いたテスト時間適応手法を提案する。
テストタイムの適応は、AIテキスト検出のための将来性のあるフレームワークである、と私たちは確信しています。
- 参考スコア(独自算出の注目度): 7.332470421231734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deployed approaches for AI text detection often rely on training-time access to labeled datasets of both human-written and AI-generated text. This approach is vulnerable to three types of distribution shifts that occur continually post-deployment, and for which labeled data is often unavailable: adversarial humanization, new LLMs being released, and temporal drift in human writing. Simultaneously, existing approaches do not leverage a key signal of LLM usage: inference-time homogeneity. We propose a test-time adaptation (TTA) approach, using semi-supervised learning, that adapts to distribution shifts by leveraging homogeneity among unlabeled samples observed at inference time. Empirically, we find that state-of-the-art supervised detectors systematically fail when they encounter distribution shifts in AI-generated and human writing, both adversarial and natural, while test-time adaptation with semi-supervised learning is largely robust; e.g., the commercial model Pangram detects just 24.1% of our adversarial AI-generated text, compared to 90.5% for our test-time approach. We establish that test-time adaptation is a promising framework for AI text detection in the wild. We publicly release our code (which includes code for model training, evaluation, and plots) at https://github.com/kkr36/llm_detection.
- Abstract(参考訳): AIテキスト検出のためのデプロイされたアプローチは、人書きテキストとAI生成テキストの両方のラベル付きデータセットへのトレーニング時間アクセスに依存することが多い。
このアプローチは、デプロイ後継続的に発生する3種類の分散シフトに対して脆弱で、ラベル付きデータがしばしば利用できない3つのタイプ – 対人化、新しいLSMのリリース、人文における時間的ドリフト – に対して脆弱である。
同時に、既存のアプローチでは、LLMの使用のキーシグナル(推論時均一性)を利用できない。
本研究では, 半教師付き学習を用いたテスト時間適応(TTA)手法を提案する。
実証的には、最先端の教師付き検出器は、AI生成と人間による文章の分散シフトに遭遇した時に体系的に失敗するのに対し、半教師付き学習によるテストタイム適応は概ね堅牢である。
テストタイムの適応は、AIテキスト検出のための将来性のあるフレームワークである、と私たちは確信しています。
私たちは、https://github.com/kkr36/llm_detectionで、私たちのコード(モデルトレーニング、評価、プロットのためのコードを含む)を公開しています。
関連論文リスト
- AEyeDE: An Attention-Based Attribution Framework for AI-Generated Text Detection [1.373282478189168]
我々は,人間-AIオーサシップ検出における属性駆動型アプローチであるtextscAEyeDEを提案する。
注意に基づく属性マップは,AIによるテキスト検出のための補完的かつ解釈可能な信号を提供する。
論文 参考訳(メタデータ) (2026-04-13T19:30:40Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - Fine-Grained Detection of AI-Generated Text Using Sentence-Level Segmentation [3.088244520495001]
人間とAI生成テキスト間の遷移を検出するための文レベルのシーケンスラベリングモデルの提案
我々のモデルは、ニューラルネットワーク(NN)と条件ランダムフィールド(CRF)を組み込んだ最先端の事前学習トランスフォーマーモデルを組み合わせる。
評価は、協力的な人間とAI生成されたテキストを含む2つの公開ベンチマークデータセットで実行される。
論文 参考訳(メタデータ) (2025-09-22T14:22:55Z) - Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [58.419940585826744]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。
属性(例えば、テキストの長さと書き込みスタイル)に基づいてデータをサブグループに分割し、FairOPTを実装して、各グループに対する決定しきい値の学習を行い、不一致を低減しました。
我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文 参考訳(メタデータ) (2025-02-06T21:58:48Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Preserving Fairness in AI under Domain Shift [15.820660013260584]
AIの公正性を保証するための既存のアルゴリズムは、単発トレーニング戦略を使用している。
ドメインシフトの下で公正な状態を維持するために公正なモデルを適用するアルゴリズムを開発する。
論文 参考訳(メタデータ) (2023-01-29T06:13:40Z) - TeST: Test-time Self-Training under Distribution Shift [99.68465267994783]
Test-Time Self-Training (TeST)は、あるソースデータとテスト時の新しいデータ分散に基づいてトレーニングされたモデルを入力する技術である。
また,TeSTを用いたモデルでは,ベースラインテスト時間適応アルゴリズムよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2022-09-23T07:47:33Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。