Fugu-MT 論文翻訳(概要): Detecting ChatGPT: A Survey of the State of Detecting ChatGPT-Generated Text

論文の概要: Detecting ChatGPT: A Survey of the State of Detecting ChatGPT-Generated Text

arxiv url: http://arxiv.org/abs/2309.07689v1
Date: Thu, 14 Sep 2023 13:05:20 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-15 14:45:39.118852
Title: Detecting ChatGPT: A Survey of the State of Detecting ChatGPT-Generated Text
Title（参考訳）: ChatGPTの検出:ChatGPT生成テキストの検出状況の調査
Authors: Mahdi Dhaini, Wessel Poelman, Ege Erdogan
Abstract要約: 生成言語モデルは、人間が生成したように見える人工的なテキストを生成することによって、潜在的に騙される可能性がある。この調査は、人間が生成したテキストとChatGPTを区別するために使われている現在のアプローチの概要を提供する。
参考スコア（独自算出の注目度）: 1.9643748953805937
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While recent advancements in the capabilities and widespread accessibility of generative language models, such as ChatGPT (OpenAI, 2022), have brought about various benefits by generating fluent human-like text, the task of distinguishing between human- and large language model (LLM) generated text has emerged as a crucial problem. These models can potentially deceive by generating artificial text that appears to be human-generated. This issue is particularly significant in domains such as law, education, and science, where ensuring the integrity of text is of the utmost importance. This survey provides an overview of the current approaches employed to differentiate between texts generated by humans and ChatGPT. We present an account of the different datasets constructed for detecting ChatGPT-generated text, the various methods utilized, what qualitative analyses into the characteristics of human versus ChatGPT-generated text have been performed, and finally, summarize our findings into general insights
Abstract（参考訳）: chatgpt (openai, 2022) のような生成言語モデルの能力の最近の進歩と広範なアクセシビリティは、人間的なテキストを生成することで様々な利点をもたらしたが、人間と大規模言語モデル(llm)を区別する作業は重要な問題となっている。これらのモデルは、人間が生成したように見える人工テキストを生成することで、潜在的に欺く可能性がある。この問題は特に法律、教育、科学といった分野において重要であり、テキストの完全性を保証することが最も重要である。この調査は、人間が生成したテキストとチャットgptを区別する現在のアプローチの概要を提供する。本稿では,ChatGPT生成テキストを検出するために構築されたさまざまなデータセットについて,その利用方法,人間とチャットGPT生成テキストの特徴に対する質的分析を行い,その結果を総合的な洞察にまとめる。

関連論文リスト

Feature Extraction and Analysis for GPT-Generated Text [0.0]
本稿では,人書きテキストとGPT生成テキストの識別のための特徴抽出と解析に関する総合的研究を行う。以上の結果から,人間とGPT生成したテキストは,特徴によって効果的に捉えられる異なる書体スタイルを示すことが明らかとなった。
論文参考訳（メタデータ） (2025-03-17T19:52:43Z)
Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.07946647012579]
既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文参考訳（メタデータ） (2024-10-04T18:42:09Z)
GPT-generated Text Detection: Benchmark Dataset and Tensor-based Detection Method [4.802604527842989]
GPT Reddit データセット(GRiD)は,GPT(Generative Pretrained Transformer)によって生成された新しいテキスト検出データセットである。データセットは、Redditに基づくコンテキストプロンプトペアと、人間生成とChatGPT生成のレスポンスで構成されている。データセットの有用性を示すために、我々は、その上でいくつかの検出方法をベンチマークし、人間とChatGPTが生成する応答を区別する効果を実証した。
論文参考訳（メタデータ） (2024-03-12T05:15:21Z)
DEMASQ: Unmasking the ChatGPT Wordsmith [63.8746084667206]
そこで本研究では,ChatGPT生成内容を正確に識別する効果的なChatGPT検出器DEMASQを提案する。提案手法は, 人為的, 機械的, 人為的, 人為的, 機械的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人
論文参考訳（メタデータ） (2023-11-08T21:13:05Z)
Is ChatGPT Involved in Texts? Measure the Polish Ratio to Detect ChatGPT-Generated Text [48.36706154871577]
我々はHPPT(ChatGPT-polished academic abstracts)と呼ばれる新しいデータセットを紹介する。純粋なChatGPT生成テキストの代わりに、人書きとChatGPTポリケートされた抽象文のペアを構成することで、既存のコーパスから分岐する。また,ChatGPTによる修正の度合いを,オリジナルの人文テキストと比較した革新的な尺度であるPolish Ratio法を提案する。
論文参考訳（メタデータ） (2023-07-21T06:38:37Z)
ChatGPT vs Human-authored Text: Insights into Controllable Text Summarization and Sentence Style Transfer [8.64514166615844]
2つの制御可能な生成タスクにおいてChatGPTの性能を体系的に検査する。生成したテキストの忠実度を評価し、そのモデルの性能を人間によるテキストと比較する。テキストを特定のスタイルに適合させる際に、ChatGPTは時に事実的誤りや幻覚を取り入れている。
論文参考訳（メタデータ） (2023-06-13T14:21:35Z)
GPT-Sentinel: Distinguishing Human and ChatGPT Generated Content [27.901155229342375]
本稿では,言語モデルを用いたChatGPT生成対人文テキストの検出手法を提案する。テストデータセットの精度は97%以上で,さまざまな指標から評価した。
論文参考訳（メタデータ） (2023-05-13T17:12:11Z)
On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。 GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文参考訳（メタデータ） (2023-04-10T17:47:39Z)
To ChatGPT, or not to ChatGPT: That is the question! [78.407861566006]
本研究は,ChatGPT検出における最新の手法を包括的かつ現代的に評価するものである。我々は、ChatGPTと人間からのプロンプトからなるベンチマークデータセットをキュレートし、医療、オープンQ&A、ファイナンスドメインからの多様な質問を含む。評価の結果,既存の手法ではChatGPT生成内容を効果的に検出できないことがわかった。
論文参考訳（メタデータ） (2023-04-04T03:04:28Z)
Comparing Abstractive Summaries Generated by ChatGPT to Real Summaries Through Blinded Reviewers and Text Classification Algorithms [0.8339831319589133]
OpenAIが開発したChatGPTは、言語モデルのファミリに最近追加されたものだ。自動メトリクスと視覚障害者による抽象要約におけるChatGPTの性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:28:33Z)
A Survey on Retrieval-Augmented Text Generation [53.04991859796971]
Retrieval-augmented text generationは顕著な利点があり、多くのNLPタスクで最先端のパフォーマンスを実現している。まず、検索拡張生成の一般的なパラダイムを強調し、異なるタスクに応じて注目すべきアプローチをレビューする。
論文参考訳（メタデータ） (2022-02-02T16:18:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。