Fugu-MT 論文翻訳(概要): LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection

論文の概要: LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection

arxiv url: http://arxiv.org/abs/2408.04284v1
Date: Thu, 8 Aug 2024 07:43:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-09 16:17:56.676358
Title: LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection
Title（参考訳）: LLM-DetectAIve:微細加工によるテキスト検出ツール
Authors: Mervat Abassy, Kareem Elozeiri, Alexander Aziz, Minh Ngoc Ta, Raj Vardhan Tomar, Bimarsha Adhikari, Saad El Dine Ahmed, Yuxia Wang, Osama Mohammed Afzal, Zhuohan Xie, Jonibek Mansurov, Ekaterina Artemova, Vladislav Mikhailov, Rui Xing, Jiahui Geng, Hasan Iqbal, Zain Muhammad Mujahid, Tarek Mahmoud, Akim Tsvigun, Alham Fikri Aji, Artem Shelmanov, Nizar Habash, Iryna Gurevych, Preslav Nakov,
Abstract要約: 我々は、細粒度MGT検出用に設計されたシステムであるtextbfLLM-DetectAIveを提示する。テキストは、人書き、機械生成、機械化、人書きの機械ポリッシュの4つのカテゴリに分類することができる。
参考スコア（独自算出の注目度）: 87.43727192273772
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The widespread accessibility of large language models (LLMs) to the general public has significantly amplified the dissemination of machine-generated texts (MGTs). Advancements in prompt manipulation have exacerbated the difficulty in discerning the origin of a text (human-authored vs machinegenerated). This raises concerns regarding the potential misuse of MGTs, particularly within educational and academic domains. In this paper, we present $\textbf{LLM-DetectAIve}$ -- a system designed for fine-grained MGT detection. It is able to classify texts into four categories: human-written, machine-generated, machine-written machine-humanized, and human-written machine-polished. Contrary to previous MGT detectors that perform binary classification, introducing two additional categories in LLM-DetectiAIve offers insights into the varying degrees of LLM intervention during the text creation. This might be useful in some domains like education, where any LLM intervention is usually prohibited. Experiments show that LLM-DetectAIve can effectively identify the authorship of textual content, proving its usefulness in enhancing integrity in education, academia, and other domains. LLM-DetectAIve is publicly accessible at https://huggingface.co/spaces/raj-tomar001/MGT-New. The video describing our system is available at https://youtu.be/E8eT_bE7k8c.
Abstract（参考訳）: 大規模言語モデル(LLM)が一般大衆に広く普及し,機械生成テキスト(MGT)の普及が著しく進んでいる。迅速な操作の進歩は、テキストの起源を識別することの難しさを悪化させた(人間による認可と機械による生成)。これはMGTの潜在的な誤用、特に教育や学術分野での懸念を提起する。本稿では,細粒度MGT検出のためのシステムである$\textbf{LLM-DetectAIve}$を提案する。テキストは、人間による書き起こし、機械による書き起こし、機械による書き起こし、人間による書き起こしの4つのカテゴリに分類することができる。従来のMGT検出器とは対照的に、LLM-DetectiAIveに2つの追加カテゴリを導入し、テキスト作成中のLLMの介入の度合いに関する洞察を提供する。これは、LLMの介入が通常禁止されている教育のようないくつかの領域で有用かもしれない。実験により, LLM-DetectAIveはテキストコンテンツの著者を効果的に同定し, 教育, アカデミア, その他の領域における整合性向上に有用であることが示された。 LLM-DetectAIveはhttps://huggingface.co/spaces/raj-tomar001/MGT-Newで公開されている。私たちのシステムを説明するビデオはhttps://youtu.be/E8eT_bE7k8cで公開されている。

関連論文リスト

Detecting LLM-Generated Text with Performance Guarantees [13.29284903739996]
GPT、Claude、Gemini、Grokといった大規模言語モデル(LLM)は、私たちの日常生活に深く統合されています。対話やメールの起草から、教育やコーディングの支援まで、幅広いタスクをサポートするようになった。極めて人間らしいテキストを生成する能力は、フェイクニュースの拡散など、深刻な懸念を提起する。
論文参考訳（メタデータ） (2026-01-10T14:52:45Z)
Real, Fake, or Manipulated? Detecting Machine-Influenced Text [56.32138057356434]
我々はHiErarchical, length-RObust machine-influenced text detector (HERO)を紹介する。 HEROは、人書き、機械生成、機械処理、機械翻訳の4つの主要なタイプから、さまざまな長さのテキストサンプルを分離することを学ぶ。
論文参考訳（メタデータ） (2025-09-18T18:41:57Z)
mdok of KInIT: Robustly Fine-tuned LLM for Binary and Multiclass AI-Generated Text Detection [0.0]
自動検出は、人間が機械生成したテキストを表示するのを助けることができる。このノートは、テキスト分類のための微調整された小さなLLMに基づいて、ロバスト検出における我々のmdokアプローチを記述している。これは、Voight-Kampff Generative AI Detection 2025の両方のサブタスクに適用される。
論文参考訳（メタデータ） (2025-06-02T14:07:32Z)
Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors [65.27124213266491]
テキスト検出を効果的に欺く訓練不要な方法である textbfContrastive textbfParaphrase textbfAttack (CoPA) を提案する。 CoPAは、大規模言語モデルによって生成される人間のような分布とは対照的に、補助的な機械的な単語分布を構築している。我々の理論的分析は、提案された攻撃の優越性を示唆している。
論文参考訳（メタデータ） (2025-05-21T10:08:39Z)
Imitate Before Detect: Aligning Machine Stylistic Preference for Machine-Revised Text Detection [39.62360229183229]
大規模言語モデル (LLM) はテキスト生成に革命をもたらした。機械生成テキストの検出はますます困難になっている。 ImBD(Imitate Before Detect)アプローチを提案する。次に、テスト対象のテキストの分布とマシンスタイルの分布を比較し、そのテキストが機械修正されたかどうかを判定する。
論文参考訳（メタデータ） (2024-12-11T03:17:14Z)
DetectRL: Benchmarking LLM-Generated Text Detection in Real-World Scenarios [38.952481877244644]
我々は,最新技術(SOTA)検出技術でさえも,このタスクにおいてまだ性能が劣っていることを強調した新しいベンチマークであるTectorRLを提案する。我々は,現在のSOTA検出器の強度と限界を明らかにした。 DetectRLは、実世界のシナリオにおける検出器の評価に有効なベンチマークになり得ると考えている。
論文参考訳（メタデータ） (2024-10-31T09:01:25Z)
GigaCheck: Detecting LLM-generated Content [72.27323884094953]
本稿では,GigaCheckを提案することによって生成したテキスト検出の課題について検討する。本研究は,LLM生成テキストとLLM生成テキストを区別する手法と,Human-Machine協調テキストにおけるLLM生成間隔を検出する手法について検討する。具体的には,テキスト内のAI生成間隔をローカライズするために,コンピュータビジョンから適応したDETRのような検出モデルと組み合わせて,微調整の汎用LLMを用いる。
論文参考訳（メタデータ） (2024-10-31T08:30:55Z)
MOSAIC: Multiple Observers Spotting AI Content, a Robust Approach to Machine-Generated Text Detection [35.67613230687864]
大規模言語モデル(LLM)は大規模に訓練され、強力なテキスト生成能力を備えている。人文テキストから人工的に生成されたものを自動判別する様々な提案がなされている。それぞれの強みを組み合わせるための、理論上は新たなアプローチを導出します。種々のジェネレータLSMを用いた実験により,本手法がロバスト検出性能を効果的に導くことが示唆された。
論文参考訳（メタデータ） (2024-09-11T20:55:12Z)
Deciphering Textual Authenticity: A Generalized Strategy through the Lens of Large Language Semantics for Detecting Human vs. Machine-Generated Text [8.290557547578146]
プリトレーニング済みのT5エンコーダとLLM埋め込みサブクラスタリングを組み合わせた,機械生成テキスト検出システムT5LLMCipherを導入する。提案手法は,機械生成テキストの平均F1スコアが19.6%増加し,非可視ジェネレータやドメインでF1スコアが平均上昇する,最先端の一般化能力を提供する。
論文参考訳（メタデータ） (2024-01-17T18:45:13Z)
AuthentiGPT: Detecting Machine-Generated Text via Black-Box Language Models Denoising [4.924903495092775]
大きな言語モデル(LLM)は、人間の文章を忠実に模倣するテキストを作成し、潜在的に誤用につながる可能性がある。本稿では,機械生成テキストと人文テキストを区別する効率的な分類器であるAuthentiGPTを提案する。ドメイン固有のデータセットの0.918 AUROCスコアで、AuthentiGPTは、他の商用アルゴリズムよりも有効であることを示した。
論文参考訳（メタデータ） (2023-11-13T19:36:54Z)
Multiscale Positive-Unlabeled Detection of AI-Generated Texts [27.956604193427772]
短文検出の難しさに対処するため,MPUトレーニングフレームワークを提案する。 MPU法は、長いAI生成テキストの検出性能を向上し、言語モデル検出器の短文検出を大幅に改善する。
論文参考訳（メタデータ） (2023-05-29T15:25:00Z)
LLMDet: A Third Party Large Language Models Generated Text Detection Tool [119.0952092533317]
大規模言語モデル(LLM)は、高品質な人間によるテキストに非常に近い。既存の検出ツールは、機械が生成したテキストと人間によるテキストしか区別できない。本稿では,モデル固有,セキュア,効率的,拡張可能な検出ツールであるLLMDetを提案する。
論文参考訳（メタデータ） (2023-05-24T10:45:16Z)
M4: Multi-generator, Multi-domain, and Multi-lingual Black-Box Machine-Generated Text Detection [69.29017069438228]
大規模言語モデル(LLM)は,多様なユーザクエリに対して,流動的な応答を生成する優れた能力を示している。これはまた、ジャーナリズム、教育、アカデミアにおけるそのようなテキストの誤用の可能性への懸念も提起している。本研究では,機械が生成したテキストを検知し,潜在的誤用を特定できる自動システムの構築を試みている。
論文参考訳（メタデータ） (2023-05-24T08:55:11Z)
MAGE: Machine-generated Text Detection in the Wild [82.70561073277801]
大規模言語モデル(LLM)は人間レベルのテキスト生成を実現し、効果的なAI生成テキスト検出の必要性を強調している。我々は、異なるLLMによって生成される多様な人文やテキストからテキストを収集することで、包括的なテストベッドを構築する。問題にもかかわらず、トップパフォーマンス検出器は、新しいLCMによって生成された86.54%のドメイン外のテキストを識別することができ、アプリケーションシナリオの実現可能性を示している。
論文参考訳（メタデータ） (2023-05-22T17:13:29Z)
Can AI-Generated Text be Reliably Detected? [54.670136179857344]
LLMの規制されていない使用は、盗作、偽ニュースの生成、スパムなど、悪意のある結果をもたらす可能性がある。最近の研究は、生成されたテキスト出力に存在する特定のモデルシグネチャを使用するか、透かし技術を適用してこの問題に対処しようとしている。本稿では,これらの検出器は実用シナリオにおいて信頼性が低いことを示す。
論文参考訳（メタデータ） (2023-03-17T17:53:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。