論文の概要: Raidar: geneRative AI Detection viA Rewriting
- arxiv url: http://arxiv.org/abs/2401.12970v1
- Date: Tue, 23 Jan 2024 18:57:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 14:46:20.641742
- Title: Raidar: geneRative AI Detection viA Rewriting
- Title(参考訳): raidar: リライトによる生成ai検出
- Authors: Chengzhi Mao, Carl Vondrick, Hao Wang, Junfeng Yang
- Abstract要約: 大規模な言語モデル(LLM)は、書き直しのタスクを行う場合、AI生成テキストよりも人間の書き起こしテキストを変更する傾向にある。
テキストの書き直しを LLM に促し,出力の編集距離を計算することで,AI 生成コンテンツを検出する手法を提案する。
この結果から,機械自体のレンズを通した機械生成テキストのユニークなインプリントが明らかになった。
- 参考スコア(独自算出の注目度): 46.403235978200776
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We find that large language models (LLMs) are more likely to modify
human-written text than AI-generated text when tasked with rewriting. This
tendency arises because LLMs often perceive AI-generated text as high-quality,
leading to fewer modifications. We introduce a method to detect AI-generated
content by prompting LLMs to rewrite text and calculating the editing distance
of the output. We dubbed our geneRative AI Detection viA Rewriting method
Raidar. Raidar significantly improves the F1 detection scores of existing AI
content detection models -- both academic and commercial -- across various
domains, including News, creative writing, student essays, code, Yelp reviews,
and arXiv papers, with gains of up to 29 points. Operating solely on word
symbols without high-dimensional features, our method is compatible with black
box LLMs, and is inherently robust on new content. Our results illustrate the
unique imprint of machine-generated text through the lens of the machines
themselves.
- Abstract(参考訳): 大規模な言語モデル(LLM)は、書き直しをタスクする場合、AI生成テキストよりも人間の書き起こしテキストを変更する傾向にある。
この傾向は、LLMがAI生成したテキストを高品質と認識し、修正が少なくなるためである。
テキストの書き直しを LLM に促し,出力の編集距離を計算することで,AI 生成コンテンツを検出する手法を提案する。
我々はジェネレーティブAI検出viA書き換え方法Raidarと名づけた。
raidarは、ニュース、クリエイティブライティング、学生エッセイ、コード、yelpレビュー、arxiv論文など、さまざまなドメインにわたる既存のaiコンテンツ検出モデルのf1検出スコアを大幅に改善し、最大29ポイントを獲得した。
本手法は,高次元の特徴を持たない単語記号のみで動作し,ブラックボックスLLMと互換性があり,新しいコンテンツに対して本質的に堅牢である。
本研究は,機械自体のレンズを通して,機械生成テキストのユニークなインプリントを示す。
関連論文リスト
- RFBES at SemEval-2024 Task 8: Investigating Syntactic and Semantic
Features for Distinguishing AI-Generated and Human-Written Texts [0.8437187555622164]
本稿では、意味論と構文という2つの異なる側面からAIが生成するテキスト検出の問題について考察する。
マルチリンガルタスクとモノリンガルタスクの両方において,AI生成テキストと人書きテキストを高い精度で区別できるAIモデルを提案する。
論文 参考訳(メタデータ) (2024-02-19T00:40:17Z) - Towards Possibilities & Impossibilities of AI-generated Text Detection:
A Survey [97.33926242130732]
大規模言語モデル(LLM)は、自然言語処理(NLP)の領域に革命をもたらし、人間のようなテキスト応答を生成する能力を持つ。
これらの進歩にもかかわらず、既存の文献のいくつかは、LLMの潜在的な誤用について深刻な懸念を提起している。
これらの懸念に対処するために、研究コミュニティのコンセンサスは、AI生成テキストを検出するアルゴリズムソリューションを開発することである。
論文 参考訳(メタデータ) (2023-10-23T18:11:32Z) - SeqXGPT: Sentence-Level AI-Generated Text Detection [62.3792779440284]
大規模言語モデル(LLM)を用いた文書の合成による文レベル検出の課題について紹介する。
次に,文レベルのAIGT検出機能として,ホワイトボックスLEMのログ確率リストを利用した textbfSequence textbfX (Check) textbfGPT を提案する。
論文 参考訳(メタデータ) (2023-10-13T07:18:53Z) - The Imitation Game: Detecting Human and AI-Generated Texts in the Era of
ChatGPT and BARD [3.2228025627337864]
異なるジャンルの人文・AI生成テキストのデータセットを新たに導入する。
テキストを分類するために、いくつかの機械学習モデルを使用します。
結果は、人間とAIが生成したテキストを識別する上で、これらのモデルの有効性を示す。
論文 参考訳(メタデータ) (2023-07-22T21:00:14Z) - RADAR: Robust AI-Text Detection via Adversarial Learning [69.5883095262619]
RADARはパラフラザーと検出器の対向訓練に基づいている。
パラフレーズの目標は、AIテキスト検出を避けるために現実的なコンテンツを生成することである。
RADARは検出器からのフィードバックを使ってパラフラザーを更新する。
論文 参考訳(メタデータ) (2023-07-07T21:13:27Z) - Beyond Black Box AI-Generated Plagiarism Detection: From Sentence to
Document Level [4.250876580245865]
既存のAI生成テキスト分類器は精度が限られており、しばしば偽陽性を生成する。
自然言語処理(NLP)技術を用いた新しい手法を提案する。
与えられた質問の複数のパラフレーズ付きバージョンを生成し、それを大きな言語モデルに入力し、回答を生成する。
本研究では,コサイン類似度に基づくコントラスト的損失関数を用いて,生成文と学生の反応とをマッチングする。
論文 参考訳(メタデータ) (2023-06-13T20:34:55Z) - Can AI-Generated Text be Reliably Detected? [54.670136179857344]
LLMの規制されていない使用は、盗作、偽ニュースの生成、スパムなど、悪意のある結果をもたらす可能性がある。
最近の研究は、生成されたテキスト出力に存在する特定のモデルシグネチャを使用するか、透かし技術を適用してこの問題に対処しようとしている。
本稿では,これらの検出器は実用シナリオにおいて信頼性が低いことを示す。
論文 参考訳(メタデータ) (2023-03-17T17:53:19Z) - Is This Abstract Generated by AI? A Research for the Gap between
AI-generated Scientific Text and Human-written Scientific Text [13.438933219811188]
本稿では,AIが生み出す科学内容と人間による文章とのギャップについて検討する。
我々は、AI生成科学テキストと人文科学テキストの間に、文章スタイルのギャップがあることを発見した。
論文 参考訳(メタデータ) (2023-01-24T04:23:20Z) - Adversarial Watermarking Transformer: Towards Tracing Text Provenance
with Data Hiding [80.3811072650087]
自然言語の透かしを防御として研究し,テキストの出所の発見と追跡に役立てる。
本稿では,適応型透かし変換器(AWT)とエンコーダ・デコーダ・デコーダを併用した対向型透かし変換器(AWT)について述べる。
AWTは、テキストにデータを隠蔽する最初のエンドツーエンドモデルである。
論文 参考訳(メタデータ) (2020-09-07T11:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。