論文の概要: MGT-Prism: Enhancing Domain Generalization for Machine-Generated Text Detection via Spectral Alignment
- arxiv url: http://arxiv.org/abs/2508.13768v1
- Date: Tue, 19 Aug 2025 12:09:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.911205
- Title: MGT-Prism: Enhancing Domain Generalization for Machine-Generated Text Detection via Spectral Alignment
- Title(参考訳): MGT-Prism:スペクトルアライメントによる機械生成テキスト検出のための領域一般化の強化
- Authors: Shengchao Liu, Xiaoming Liu, Chengzhengxu Li, Zhaohan Zhang, Guoxin Ma, Yu Lan, Shuai Xiao,
- Abstract要約: MGT-Prismは周波数領域の観点からMGT検出法である。
MGT-Prismの精度は平均0.90%,F1スコアは0.92%向上した。
- 参考スコア(独自算出の注目度): 17.97372204752458
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Models have shown growing ability to generate fluent and coherent texts that are highly similar to the writing style of humans. Current detectors for Machine-Generated Text (MGT) perform well when they are trained and tested in the same domain but generalize poorly to unseen domains, due to domain shift between data from different sources. In this work, we propose MGT-Prism, an MGT detection method from the perspective of the frequency domain for better domain generalization. Our key insight stems from analyzing text representations in the frequency domain, where we observe consistent spectral patterns across diverse domains, while significant discrepancies in magnitude emerge between MGT and human-written texts (HWTs). The observation initiates the design of a low frequency domain filtering module for filtering out the document-level features that are sensitive to domain shift, and a dynamic spectrum alignment strategy to extract the task-specific and domain-invariant features for improving the detector's performance in domain generalization. Extensive experiments demonstrate that MGT-Prism outperforms state-of-the-art baselines by an average of 0.90% in accuracy and 0.92% in F1 score on 11 test datasets across three domain-generalization scenarios.
- Abstract(参考訳): 大規模言語モデルでは、人間の書き方と非常によく似た、流動的で一貫性のあるテキストを生成する能力が高まっている。
MGT(Machine-Generated Text)の現在の検出器は、同じドメインでトレーニングされ、テストされた時にうまく機能するが、異なるソースのデータ間のドメインシフトのため、目に見えないドメインにあまり一般化しない。
本研究では,周波数領域の観点からMGT検出手法MGT-Prismを提案する。
我々の重要な洞察は、様々な領域にわたる一貫したスペクトルパターンを観察する周波数領域におけるテキスト表現の分析に起因し、MGTと人文テキスト(HWT)の間には大きな相違が生じている。
この観測は、ドメインシフトに敏感な文書レベルの特徴をフィルタリングする低周波領域フィルタリングモジュールの設計を開始し、動的スペクトルアライメント戦略により、ドメイン一般化における検出器の性能を向上させるためのタスク固有およびドメイン不変の特徴を抽出する。
大規模な実験により、MGT-Prismは3つのドメイン一般化シナリオにわたる11のテストデータセットにおいて、平均0.90%の精度で、F1スコアの0.92%で最先端のベースラインを上回っていることが示された。
関連論文リスト
- Multi-Granularity Feature Calibration via VFM for Domain Generalized Semantic Segmentation [15.35795137118814]
ドメイン一般化セマンティック(DGSS)は、トレーニング中にターゲットデータにアクセスすることなく、目に見えないドメインにまたがるモデルの一般化能力を改善することを目的としている。
DGSSの最近の進歩は、パラメータ効率の良い微調整戦略を通じて、視覚基盤モデル(VFM)をますます活用している。
ドメインシフト下での強靭性を高めるために,VFM特徴の粗大なアライメントを行う新しいフレームワークであるMulti-Granularity Feature (MGFC)を提案する。
論文 参考訳(メタデータ) (2025-08-05T02:24:31Z) - Text-Driven Causal Representation Learning for Source-Free Domain Generalization [82.75041792888274]
我々は、ソースフリー領域一般化設定に因果推論を統合する最初の方法であるTDCRLを提案する。
我々のアプローチは、堅牢でドメイン不変な特徴を達成するための明確で効果的なメカニズムを提供し、堅牢な一般化を保証する。
論文 参考訳(メタデータ) (2025-07-14T06:20:42Z) - On the Generalization and Adaptation Ability of Machine-Generated Text Detectors in Academic Writing [23.434925348283617]
本研究では,MGT検出器の一般化と適応性について,学術書誌に特有の3つの重要な側面で検討する。
ドメイン内設定とドメイン間設定の両方において、バイナリ分類および帰属タスクのための様々な検出器の性能をベンチマークする。
本研究は,MGT検出器の多種多様なシナリオにおける一般化と適応性に関する知見を提供し,ロバストで適応的な検出システム構築の基礎を築いた。
論文 参考訳(メタデータ) (2024-12-23T03:30:34Z) - Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuning [55.107329995417786]
大規模言語モデル(LLM)は、目覚ましい一般的な理解と生成能力を示している。
我々は、25のドイツ語$Leftrightarrow$ Englishと22の中国語$Leftrightarrow$ Englishテストセットを特徴とするマルチドメイン翻訳のベンチマークを確立する。
本稿では,LLMの内在的マルチドメインインテリジェンスを活用し,翻訳性能を向上させるためのドメインチェーン・オブ・シント(CoT)ファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T16:15:04Z) - Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images [63.58800688320182]
ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
論文 参考訳(メタデータ) (2024-05-24T22:13:31Z) - TeG-DG: Textually Guided Domain Generalization for Face Anti-Spoofing [8.830873674673828]
既存の方法は、様々な訓練領域からドメイン不変の特徴を抽出することを目的としている。
抽出された特徴は、必然的に残差スタイルの特徴バイアスを含んでおり、その結果、一般化性能が劣る。
本稿では,テキスト情報をドメイン間アライメントに有効活用するテキストガイド型ドメイン一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-30T10:13:46Z) - Improving Domain Generalization with Domain Relations [77.63345406973097]
本稿では、モデルがトレーニングされたドメインと異なる新しいドメインに適用されたときに発生するドメインシフトに焦点を当てる。
ドメイン固有モデルを学習するためのD$3$Gという新しい手法を提案する。
以上の結果から,D$3$Gは最先端の手法より一貫して優れていた。
論文 参考訳(メタデータ) (2023-02-06T08:11:16Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Robust Domain-Free Domain Generalization with Class-aware Alignment [4.442096198968069]
ドメインフリードメイン一般化(DFDG)は、目に見えないテストドメインでより良い一般化性能を実現するモデル非依存の方法である。
DFDGは新しい戦略を用いてドメイン不変なクラス差別的特徴を学習する。
時系列センサと画像分類公開データセットの両方で競合性能を得る。
論文 参考訳(メタデータ) (2021-02-17T17:46:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。