論文の概要: M-DAIGT: A Shared Task on Multi-Domain Detection of AI-Generated Text
- arxiv url: http://arxiv.org/abs/2511.11340v1
- Date: Fri, 14 Nov 2025 14:26:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.649402
- Title: M-DAIGT: A Shared Task on Multi-Domain Detection of AI-Generated Text
- Title(参考訳): M-DAIGT:AI生成テキストのマルチドメイン検出のための共有タスク
- Authors: Salima Lamsiyah, Saad Ezzini, Abdelkader El Mahdaouy, Hamza Alami, Abdessamad Benlahbib, Samir El Amrany, Salmane Chafik, Hicham Hammouchi,
- Abstract要約: 本稿では,M-DAIGT(Multi-Domain Detection of AI-Generated Text)共有タスクを提案する。
M-DAIGTは、ニュース記事検出(NAD)とアカデミック記述検出(AWD)の2つのバイナリ分類サブタスクからなる。
合計46のチームが共有タスクに登録され、4つのチームが最終結果を提出した。
- 参考スコア(独自算出の注目度): 3.91352287996586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The generation of highly fluent text by Large Language Models (LLMs) poses a significant challenge to information integrity and academic research. In this paper, we introduce the Multi-Domain Detection of AI-Generated Text (M-DAIGT) shared task, which focuses on detecting AI-generated text across multiple domains, particularly in news articles and academic writing. M-DAIGT comprises two binary classification subtasks: News Article Detection (NAD) (Subtask 1) and Academic Writing Detection (AWD) (Subtask 2). To support this task, we developed and released a new large-scale benchmark dataset of 30,000 samples, balanced between human-written and AI-generated texts. The AI-generated content was produced using a variety of modern LLMs (e.g., GPT-4, Claude) and diverse prompting strategies. A total of 46 unique teams registered for the shared task, of which four teams submitted final results. All four teams participated in both Subtask 1 and Subtask 2. We describe the methods employed by these participating teams and briefly discuss future directions for M-DAIGT.
- Abstract(参考訳): LLM(Large Language Models)による高度に流動的なテキストの生成は、情報整合性と学術研究に重大な課題をもたらす。
本稿では、特にニュース記事や学術論文において、複数の分野にわたるAI生成テキストの検出に焦点を当てた、AI生成テキストのマルチドメイン検出(M-DAIGT)タスクを提案する。
M-DAIGTは、ニュース記事検出(NAD)(Subtask1)とアカデミック記述検出(AWD)(Subtask2)の2つのバイナリ分類サブタスクからなる。
このタスクをサポートするために、人書きテキストとAI生成テキストのバランスをとる3万のサンプルからなる、新しい大規模ベンチマークデータセットを開発し、リリースしました。
AI生成したコンテンツは、様々な現代的なLCM(例えば、GPT-4、Claude)と多様なプロンプト戦略を用いて作成された。
合計46のチームが共有タスクに登録され、4つのチームが最終結果を提出した。
4チームともSubtask 1とSubtask 2に出場した。
本報告では,これらの参加チームが採用する手法について述べるとともに,M-DAIGTの今後の方向性について概説する。
関連論文リスト
- AI-generated Text Detection: A Multifaceted Approach to Binary and Multiclass Classification [0.13392361199400257]
大規模言語モデル(LLM)は、人間の文章によく似たテキストを生成する際、顕著な能力を示した。
このような機能は、偽ニュース生成、スパムメールの作成、学術的課題における誤用など、潜在的な誤用につながる。
最適化されたモデルとより単純なバリエーションの2つのニューラルアーキテクチャを提案する。
タスクAでは、最適化されたニューラルアーキテクチャが0.994ドルのF1$スコアで5位、タスクBでは、単純なニューラルアーキテクチャが0.627のF1$スコアで5位にランクインした。
論文 参考訳(メタデータ) (2025-05-15T09:28:06Z) - GenAI Content Detection Task 1: English and Multilingual Machine-Generated Text Detection: AI vs. Human [71.42669028683741]
我々は,Coling 2025におけるGenAIワークショップの一環として,バイナリマシン生成テキスト検出における共有タスクを提案する。
このタスクは、モノリンガル(英: Monolingual)とマルチリンガル(英: Multilingual)の2つのサブタスクから構成される。
本稿では,データの包括的概要,結果の概要,参加システムの詳細な説明,提出内容の詳細な分析について述べる。
論文 参考訳(メタデータ) (2025-01-19T11:11:55Z) - GenAI Content Detection Task 3: Cross-Domain Machine-Generated Text Detection Challenge [71.69373986176839]
モデルが巨大な、固定された、多数のドメインとLLMから生成されたテキストを検出できるかどうかを問う。
3ヶ月の間に、23の検出器を提出した9つのチームによって、我々のタスクが試みられた。
その結果, RAID から生成したテキストに対して, 5% の偽陽性率を維持しながら, 精度が 99% を超えることが判明した。
論文 参考訳(メタデータ) (2025-01-15T16:21:09Z) - Advacheck at GenAI Detection Task 1: AI Detection Powered by Domain-Aware Multi-Tasking [0.0]
本稿では,GenAI検出タスク1コンペティションのモノリンガルサブタスクにおいて,機械生成テキストと人文テキストを認識できるようにAdvacheckチームが設計したシステムについて述べる。
開発したシステムはマルチタスクアーキテクチャであり,複数の分類ヘッド間で共用トランスフォーマーを備える。
論文 参考訳(メタデータ) (2024-11-18T17:03:30Z) - GigaCheck: Detecting LLM-generated Content [72.27323884094953]
本稿では,GigaCheckを提案することによって生成したテキスト検出の課題について検討する。
本研究は,LLM生成テキストとLLM生成テキストを区別する手法と,Human-Machine協調テキストにおけるLLM生成間隔を検出する手法について検討する。
具体的には,テキスト内のAI生成間隔をローカライズするために,コンピュータビジョンから適応したDETRのような検出モデルと組み合わせて,微調整の汎用LLMを用いる。
論文 参考訳(メタデータ) (2024-10-31T08:30:55Z) - SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - Multitask Multimodal Prompted Training for Interactive Embodied Task
Completion [48.69347134411864]
Embodied MultiModal Agent (EMMA) はエンコーダとデコーダの統一モデルである。
すべてのタスクをテキスト生成として統一することで、EMMAはタスク間の転送を容易にするアクション言語を学ぶ。
論文 参考訳(メタデータ) (2023-11-07T15:27:52Z) - Findings of the The RuATD Shared Task 2022 on Artificial Text Detection
in Russian [6.9244605050142995]
2022年に行われた対話評価イニシアチブの一環として組織されたロシア語における人工テキスト検出の共有タスクについて紹介する。
このデータセットには14のテキストジェネレータ、すなわち1人の人間ライターと13のテキスト生成モデルからのテキストが含まれている。
人書きのテキストは、複数のドメインにわたる公開リソースから収集される。
論文 参考訳(メタデータ) (2022-06-03T14:12:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。