論文の概要: Automatic detection of Gen-AI texts: A comparative framework of neural models
- arxiv url: http://arxiv.org/abs/2603.18750v1
- Date: Thu, 19 Mar 2026 10:55:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.09834
- Title: Automatic detection of Gen-AI texts: A comparative framework of neural models
- Title(参考訳): Gen-AIテキストの自動検出:ニューラルモデルの比較フレームワーク
- Authors: Cristian Buttaro, Irene Amerini,
- Abstract要約: 本稿では,複数の機械学習ベース検出器の設計,実装,評価を通じて,AIが生成するテキスト検出の問題について検討する。
マルチレイヤパーセプトロン、1次元畳み込みニューラルネットワーク、MobileNetベースのCNN、トランスフォーマーモデルという4つのニューラルネットワークが開発・分析されている。
その結果、教師付き検出器は、様々な言語やドメインにわたる商用ツールよりも安定で堅牢な性能を実現することがわかった。
- 参考スコア(独自算出の注目度): 8.423689720638846
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The rapid proliferation of Large Language Models has significantly increased the difficulty of distinguishing between human-written and AI generated texts, raising critical issues across academic, editorial, and social domains. This paper investigates the problem of AI generated text detection through the design, implementation, and comparative evaluation of multiple machine learning based detectors. Four neural architectures are developed and analyzed: a Multilayer Perceptron, a one-dimensional Convolutional Neural Network, a MobileNet-based CNN, and a Transformer model. The proposed models are benchmarked against widely used online detectors, including ZeroGPT, GPTZero, QuillBot, Originality.AI, Sapling, IsGen, Rephrase, and Writer. Experiments are conducted on the COLING Multilingual Dataset, considering both English and Italian configurations, as well as on an original thematic dataset focused on Art and Mental Health. Results show that supervised detectors achieve more stable and robust performance than commercial tools across different languages and domains, highlighting key strengths and limitations of current detection strategies.
- Abstract(参考訳): 大規模言語モデルの急速な普及は、人間が書き起こしたテキストとAI生成したテキストを区別することの難しさを著しく増加させ、学術、編集、社会ドメインで重要な問題を引き起こした。
本稿では,複数の機械学習ベース検出器の設計,実装,比較評価を通じて,AIが生成するテキスト検出の問題について検討する。
マルチレイヤパーセプトロン、1次元畳み込みニューラルネットワーク、MobileNetベースのCNN、トランスフォーマーモデルという4つのニューラルネットワークが開発・分析されている。
提案されたモデルは、ZeroGPT, GPTZero, QuillBot, Originality.AI, Sapling, IsGen, Rephrase, Writerなど、広く使われているオンライン検出器に対してベンチマークされている。
COling Multilingual Datasetでの実験が行われ、英語とイタリア語の設定と、アートとメンタルヘルスに焦点を当てたオリジナルのテーマデータセットが検討されている。
その結果、教師付き検出器は様々な言語やドメインにわたる商用ツールよりも安定的で堅牢な性能を実現し、現在の検出戦略の重要な強みと限界を強調した。
関連論文リスト
- DependencyAI: Detecting AI Generated Text through Dependency Parsing [10.075606234222963]
本稿では,AI生成テキストを検出するための簡易かつ解釈可能なアプローチであるDependencyAIを紹介する。
本手法は,モノリンガル,マルチジェネレータ,多言語設定間での競合性能を実現する。
論文 参考訳(メタデータ) (2026-02-17T11:42:28Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - Fine-Grained Detection of AI-Generated Text Using Sentence-Level Segmentation [3.088244520495001]
人間とAI生成テキスト間の遷移を検出するための文レベルのシーケンスラベリングモデルの提案
我々のモデルは、ニューラルネットワーク(NN)と条件ランダムフィールド(CRF)を組み込んだ最先端の事前学習トランスフォーマーモデルを組み合わせる。
評価は、協力的な人間とAI生成されたテキストを含む2つの公開ベンチマークデータセットで実行される。
論文 参考訳(メタデータ) (2025-09-22T14:22:55Z) - Assessing Classical Machine Learning and Transformer-based Approaches for Detecting AI-Generated Research Text [0.0]
機械学習アプローチは、ChatGPT-3.5生成したテキストと人間のテキストを区別することができる。
DistilBERTは全体的な最高のパフォーマンスを達成し、Logistic RegressionとBERT-Customはしっかりとしたバランスの取れた代替手段を提供する。
論文 参考訳(メタデータ) (2025-09-20T04:36:21Z) - Where are we in audio deepfake detection? A systematic analysis over generative and detection models [59.09338266364506]
SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供する。
従来のモデルベース検出システムと基礎モデルベース検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文 参考訳(メタデータ) (2024-10-06T01:03:42Z) - Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.07946647012579]
既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。
本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文 参考訳(メタデータ) (2024-10-04T18:42:09Z) - Technical Report on the Pangram AI-Generated Text Classifier [0.14732811715354457]
トランスフォーマーをベースとしたニューラルネットワークであるPangram Textについて紹介する。
パングラムテキストは英語以外の話者に偏りがなく、訓練中に見つからないドメインやモデルに一般化されていることを示す。
論文 参考訳(メタデータ) (2024-02-21T17:13:41Z) - On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。
GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文 参考訳(メタデータ) (2023-04-10T17:47:39Z) - How much do language models copy from their training data? Evaluating
linguistic novelty in text generation using RAVEN [63.79300884115027]
現在の言語モデルは高品質なテキストを生成することができる。
彼らは、これまで見たテキストを単にコピーしているか、それとも一般化可能な言語的抽象化を学んだのか?
本稿では、生成したテキストの新規性を評価するための分析スイートであるRAVENを紹介する。
論文 参考訳(メタデータ) (2021-11-18T04:07:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。