論文の概要: AI-Generated Text is Non-Stationary: Detection via Temporal Tomography
- arxiv url: http://arxiv.org/abs/2508.01754v1
- Date: Sun, 03 Aug 2025 13:43:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.050109
- Title: AI-Generated Text is Non-Stationary: Detection via Temporal Tomography
- Title(参考訳): AI生成テキストは非定常である:時間トモグラフィによる検出
- Authors: Alva West, Yixuan Weng, Minjun Zhu, Luodan Zhang, Zhen Lin, Guangsheng Bao, Yue Zhang,
- Abstract要約: 本稿では,信号処理タスクとして検出を再構成することによって位置情報を保存する新しい検出パラダイムであるTDTを紹介する。
RAIDベンチマークでは、TDTは0.855 AUROC(最高のベースラインよりも7.1%改善)を達成した。
我々の研究は、AI生成テキストの基本的な特徴として非定常性を確立し、時間的ダイナミクスの保存が堅牢な検出に不可欠であることを示す。
- 参考スコア(独自算出の注目度): 22.431500389494836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The field of AI-generated text detection has evolved from supervised classification to zero-shot statistical analysis. However, current approaches share a fundamental limitation: they aggregate token-level measurements into scalar scores, discarding positional information about where anomalies occur. Our empirical analysis reveals that AI-generated text exhibits significant non-stationarity, statistical properties vary by 73.8\% more between text segments compared to human writing. This discovery explains why existing detectors fail against localized adversarial perturbations that exploit this overlooked characteristic. We introduce Temporal Discrepancy Tomography (TDT), a novel detection paradigm that preserves positional information by reformulating detection as a signal processing task. TDT treats token-level discrepancies as a time-series signal and applies Continuous Wavelet Transform to generate a two-dimensional time-scale representation, capturing both the location and linguistic scale of statistical anomalies. On the RAID benchmark, TDT achieves 0.855 AUROC (7.1\% improvement over the best baseline). More importantly, TDT demonstrates robust performance on adversarial tasks, with 14.1\% AUROC improvement on HART Level 2 paraphrasing attacks. Despite its sophisticated analysis, TDT maintains practical efficiency with only 13\% computational overhead. Our work establishes non-stationarity as a fundamental characteristic of AI-generated text and demonstrates that preserving temporal dynamics is essential for robust detection.
- Abstract(参考訳): AIによるテキスト検出の分野は、教師付き分類からゼロショット統計分析へと進化してきた。
しかしながら、現在のアプローチでは、トークンレベルの測定をスカラースコアに集約し、異常が発生した場所に関する位置情報を破棄するという、基本的な制限を共有している。
我々の経験的分析によると、AI生成したテキストは、有意な非定常性を示し、統計的性質は、人間の書き方に比べて、テキストセグメント間で73.8倍も変化している。
この発見は、既存の検出器が、この見過ごされた特徴を生かした、局部的な逆方向の摂動に対して失敗する理由を説明する。
本稿では,信号処理タスクとして検出を再構成することによって位置情報を保存する新しい検出パラダイムであるTDTを紹介する。
TDTは、トークンレベルの不一致を時系列信号として扱い、連続ウェーブレット変換を用いて2次元の時間スケール表現を生成し、統計的異常の場所と言語スケールの両方をキャプチャする。
RAIDベンチマークでは、TDTは0.855 AUROC(最高のベースラインよりも7.1\%改善)を達成した。
さらに重要なことに、TDTは、HARTレベル2パラフレーズ攻撃において14.1\%のAUROCの改善により、敵タスクに対する堅牢なパフォーマンスを示す。
その高度な分析にもかかわらず、TDTは計算オーバーヘッドをわずか13倍に抑え、実用的効率を維持している。
我々の研究は、AI生成テキストの基本的な特徴として非定常性を確立し、時間的ダイナミクスの保存が堅牢な検出に不可欠であることを示す。
関連論文リスト
- T-Detect: Tail-Aware Statistical Normalization for Robust Detection of Adversarial Machine-Generated Text [15.880428198252046]
既存のゼロショット検出器は、しばしばガウス分布を暗黙的に仮定する統計測度に依存する。
本稿では、曲率に基づく検出器の統計コアを根本的に再設計する新しい検出法であるT-Detectを紹介する。
我々の貢献は、テキスト検出の理論的に正当化された新しい統計基盤、優れた堅牢性を示すアブレーション検証法、および敵条件下での性能の包括的解析である。
論文 参考訳(メタデータ) (2025-07-31T14:08:04Z) - Frame-level Temporal Difference Learning for Partial Deepfake Speech Detection [16.923285534924116]
不自然な時間変動を識別する部分的な深度検出を再定義する時間差注意モジュール(TDAM)を提案する。
二重レベルの階層的差分表現は、微細なスケールと粗いスケールの両方で時間的不規則性を捕捉する一方、適応的な平均プーリングは、情報損失を最小限に抑えるために、可変長入力における必須パターンを保存する。
当社のTDAM-AvgPoolモデルは,PartialSpoofデータセットで0.59%,HADデータセットで0.03%,最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2025-07-20T19:46:23Z) - Bridging the Reality Gap in Digital Twins with Context-Aware, Physics-Guided Deep Learning [3.0996501197166975]
デジタルツイン(DT)は強力な予測分析を可能にするが、シミュレーションと実際のシステムの相違 - 現実のギャップとして知られ、信頼性を損なう。
本稿では,新しいセンサデータを連続的に統合し,誤りを検知し,クエリ応答フレームワークを介してDTを再検討する,DTのためのReal Gap Analysis(RGA)モジュールを提案する。
提案手法は,コンテキスト推論の改善と物理的整合性維持のために,ドメイン・アドバイサル深層学習と低次シミュレータ誘導を融合する。
論文 参考訳(メタデータ) (2025-05-17T05:18:46Z) - From Pixels to Trajectory: Universal Adversarial Example Detection via Temporal Imprints [21.454396392842426]
我々は,対立例(AE)攻撃による識別可能な時間的(または歴史的)軌跡のインプリントを公表した。
AE検出のためのTRAIT(TRaceable Adrial temporal trajectory ImprinTs)を提案する。
TRAIT は AE 検出精度が 97% を超え、多くの場合 99% 程度であり、偽の拒絶率 1% を維持している。
論文 参考訳(メタデータ) (2025-03-06T06:00:04Z) - Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [60.09665704993751]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。
我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文 参考訳(メタデータ) (2025-02-06T21:58:48Z) - Adversarial Attacks on AI-Generated Text Detection Models: A Token Probability-Based Approach Using Embeddings [14.150011713654331]
本研究では,Fast-DetectGPTなどの検出モデルに対する新たなテキスト逆攻撃を提案する。
この手法では、AI生成したテキストの再構築を目的として、データ摂動の埋め込みモデルを用いて、テキストの真の起源を検出する可能性を低減する。
論文 参考訳(メタデータ) (2025-01-31T10:06:27Z) - Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.07946647012579]
既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。
本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文 参考訳(メタデータ) (2024-10-04T18:42:09Z) - Detecting Anomalies in Dynamic Graphs via Memory enhanced Normality [39.476378833827184]
動的グラフにおける異常検出は、グラフ構造と属性の時間的進化によって大きな課題となる。
時空間記憶強調グラフオートエンコーダ(STRIPE)について紹介する。
STRIPEは、AUCスコアが5.8%改善し、トレーニング時間が4.62倍速く、既存の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-03-14T02:26:10Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Sequential Attention Source Identification Based on Feature
Representation [88.05527934953311]
本稿では,テンポラルシーケンスに基づくグラフ注意源同定(TGASI)と呼ばれるシーケンス・ツー・シーケンス・ベースのローカライズ・フレームワークを提案する。
なお、このインダクティブラーニングのアイデアは、TGASIが他の事前の知識を知らずに新しいシナリオのソースを検出できることを保証する。
論文 参考訳(メタデータ) (2023-06-28T03:00:28Z) - On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。
GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文 参考訳(メタデータ) (2023-04-10T17:47:39Z) - Artificial Text Detection via Examining the Topology of Attention Maps [58.46367297712477]
トポロジカルデータ分析(TDA)に基づく3種類の解釈可能なトポロジカル特徴を提案する。
BERTモデルから派生した特徴が3つの共通データセットにおいて、カウントベースとニューラルベースベースラインを最大10%上回っていることを実証的に示す。
特徴の探索解析は表面に対する感度と構文的性質を明らかにしている。
論文 参考訳(メタデータ) (2021-09-10T12:13:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。