Fugu-MT 論文翻訳(概要): A Survey of AI-generated Text Forensic Systems: Detection, Attribution, and Characterization

論文の概要: A Survey of AI-generated Text Forensic Systems: Detection, Attribution, and Characterization

arxiv url: http://arxiv.org/abs/2403.01152v1
Date: Sat, 2 Mar 2024 09:39:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-05 14:57:07.948837
Title: A Survey of AI-generated Text Forensic Systems: Detection, Attribution, and Characterization
Title（参考訳）: aiによるテキスト鑑識システムに関する調査研究 : 検出・帰属・特徴付け
Authors: Tharindu Kumarage, Garima Agrawal, Paras Sheth, Raha Moraffah, Aman Chadha, Joshua Garland, Huan Liu
Abstract要約: AI生成テキスト鑑定は、LLMの誤用に対処する新たな分野である。本稿では,検出,帰属,特性の3つの主要な柱に着目した詳細な分類法を紹介する。我々は、AI生成テキスト法医学研究の利用可能なリソースを探究し、AI時代の法医学システムの進化的課題と今後の方向性について論じる。
参考スコア（独自算出の注目度）: 13.44566185792894
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We have witnessed lately a rapid proliferation of advanced Large Language Models (LLMs) capable of generating high-quality text. While these LLMs have revolutionized text generation across various domains, they also pose significant risks to the information ecosystem, such as the potential for generating convincing propaganda, misinformation, and disinformation at scale. This paper offers a review of AI-generated text forensic systems, an emerging field addressing the challenges of LLM misuses. We present an overview of the existing efforts in AI-generated text forensics by introducing a detailed taxonomy, focusing on three primary pillars: detection, attribution, and characterization. These pillars enable a practical understanding of AI-generated text, from identifying AI-generated content (detection), determining the specific AI model involved (attribution), and grouping the underlying intents of the text (characterization). Furthermore, we explore available resources for AI-generated text forensics research and discuss the evolving challenges and future directions of forensic systems in an AI era.
Abstract（参考訳）: 我々は最近,高品質なテキストを生成する高度言語モデル(LLM)の急速な普及を目撃している。これらのLSMは、様々な領域でテキスト生成に革命をもたらしたが、説得力のあるプロパガンダ、誤情報、偽情報を大規模に生成する可能性など、情報エコシステムに重大なリスクをもたらす。本稿では,LLM誤用問題に対処する新たな分野である,AIによるテキスト鑑定システムのレビューを行う。本稿では,ai生成テキスト法医学における既存の取り組みの概要を,検出,帰属,特徴付けという3つの主要な柱に着目し,詳細な分類法を紹介する。これらの柱は、AI生成されたコンテンツ(検出)を特定し、関連するAIモデルを決定する(属性)、テキスト(特性)の基本的な意図をグループ化するなど、AI生成されたテキストの実践的な理解を可能にします。さらに、AI生成テキスト法医学研究の利用可能なリソースを調査し、AI時代の法医学システムの進化的課題と今後の方向性について議論する。

関連論文リスト

ChatGpt Content detection: A new approach using xlm-roberta alignment [0.0]
本稿では,最先端多言語変換モデルであるXLM-RoBERTaを用いて,AI生成テキストを検出するための包括的手法を提案する。我々は、人間とAIが生成したテキストのバランスのとれたデータセット上でモデルを微調整し、その性能を評価した。我々の発見は、学術的完全性を維持するための貴重なツールを提供し、AI倫理の幅広い分野に貢献する。
論文参考訳（メタデータ） (2025-11-26T03:16:57Z)
AIGI-Holmes: Towards Explainable and Generalizable AI-Generated Image Detection via Multimodal Large Language Models [78.08374249341514]
AI生成コンテンツ(AIGC)の急速な発展は、誤情報を拡散するAIGIの誤用につながった。大規模で包括的なデータセットであるHolmes-Setを導入し、画像がAI生成されているかどうかを解説したインストラクションチューニングデータセットを含む。本研究は,MLLMの構造化説明と品質管理によるデータ生成を効率化する,Multi-Expert Juryと呼ばれる効率的なデータアノテーション手法を提案する。さらに,視覚専門家による事前学習,教師付き微調整,直接選好最適化を含む3段階学習フレームワークであるHolmes Pipelineを提案する。
論文参考訳（メタデータ） (2025-07-03T14:26:31Z)
Information Retrieval in the Age of Generative AI: The RGB Model [77.96475639967431]
本稿では,生成型AIツールの利用の増加に伴って生じる複雑な情報ダイナミクスについて,新たな定量的アプローチを提案する。本稿では,新たなトピックに応答して情報の生成,索引付け,普及を特徴付けるモデルを提案する。以上の結果から,AI導入の急激なペースとユーザ依存度の増加は,不正確な情報拡散のリスクを増大させる可能性が示唆された。
論文参考訳（メタデータ） (2025-04-29T10:21:40Z)
Tracing Thought: Using Chain-of-Thought Reasoning to Identify the LLM Behind AI-Generated Text [1.7034813545878589]
COT Fine-tunedはAI生成テキストを検出するための新しいフレームワークである。提案手法の主な革新は,チェーン・オブ・ソート推論の利用である。実験の結果、COTは両方のタスクで高精度に調整された。
論文参考訳（メタデータ） (2025-04-23T17:39:49Z)
Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing [55.2480439325792]
誤分類は、偽の盗作行為の告発や、オンラインコンテンツにおけるAIの普及に関する誤解を招く可能性がある。我々は、AI-Polished-Text Evaluationデータセットを用いて、最先端の11のAIテキスト検出を体系的に評価した。我々の発見によると、検出器は、最小限に磨き上げられたテキストをAI生成と誤分類し、AIの関与度を区別し、古いモデルと小さなモデルに偏見を示す。
論文参考訳（メタデータ） (2025-02-21T18:45:37Z)
Exploring AI Text Generation, Retrieval-Augmented Generation, and Detection Technologies: a Comprehensive Overview [0.0]
独創性、偏見、誤情報、説明責任などの問題を含む、AI生成コンテンツを取り巻く懸念が顕在化している。本稿では、AIテキストジェネレータ(AITG)の進化、能力、倫理的意味を概観する。本稿では,検出精度の向上,倫理的AI開発支援,アクセシビリティ向上に向けた今後の方向性について検討する。
論文参考訳（メタデータ） (2024-12-05T07:23:14Z)
Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.07946647012579]
既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文参考訳（メタデータ） (2024-10-04T18:42:09Z)
Detecting Machine-Generated Texts: Not Just "AI vs Humans" and Explainability is Complicated [8.77447722226144]
そこで本研究では,新たな3次テキスト分類手法を導入し,いずれの情報源にも起因する可能性のあるテキストの「未決定」カテゴリを追加する。この研究は、単に分類から機械が生成したテキストの説明へとパラダイムをシフトさせ、ユーザーに対して明確で理解可能な説明を提供するための検出器の必要性を強調した。
論文参考訳（メタデータ） (2024-06-26T11:11:47Z)
Detecting AI-Generated Text: Factors Influencing Detectability with Current Methods [13.14749943120523]
テキストが人工知能(AI)によって作成されたかどうかを知ることは、その信頼性を決定する上で重要である。 AIGT検出に対する最先端のアプローチには、透かし、統計学的およびスタイリスティック分析、機械学習分類などがある。 AIGTテキストがどのようなシナリオで「検出可能」であるかを判断するために、結合する健全な要因についての洞察を提供することを目指している。
論文参考訳（メタデータ） (2024-06-21T18:31:49Z)
Enhancing Text Authenticity: A Novel Hybrid Approach for AI-Generated Text Detection [8.149808049643344]
本稿では,TF-IDF技術と高度な機械学習モデルを組み合わせた新しいハイブリッド手法を提案する。提案手法は既存手法と比較して優れた性能を発揮する。
論文参考訳（メタデータ） (2024-06-01T10:21:54Z)
Spotting AI's Touch: Identifying LLM-Paraphrased Spans in Text [61.22649031769564]
我々は、新しいフレームワーク、パラフレーズテキストスパン検出(PTD)を提案する。 PTDは、テキスト内でパラフレーズ付きテキストを識別することを目的としている。パラフレーズ付きテキストスパン検出のための専用データセットであるPASTEDを構築した。
論文参考訳（メタデータ） (2024-05-21T11:22:27Z)
Towards Possibilities & Impossibilities of AI-generated Text Detection: A Survey [97.33926242130732]
大規模言語モデル(LLM)は、自然言語処理(NLP)の領域に革命をもたらし、人間のようなテキスト応答を生成する能力を持つ。これらの進歩にもかかわらず、既存の文献のいくつかは、LLMの潜在的な誤用について深刻な懸念を提起している。これらの懸念に対処するために、研究コミュニティのコンセンサスは、AI生成テキストを検出するアルゴリズムソリューションを開発することである。
論文参考訳（メタデータ） (2023-10-23T18:11:32Z)
Neural Authorship Attribution: Stylometric Analysis on Large Language Models [16.63955074133222]
GPT-4、PaLM、Llamaのような大規模言語モデル(LLM)は、AIによるテキスト生成を著しく推進している。誤用の可能性に対する懸念が高まっているため、AI生成テキストの鑑識の必要性が高まっている。
論文参考訳（メタデータ） (2023-08-14T17:46:52Z)
MAGE: Machine-generated Text Detection in the Wild [82.70561073277801]
大規模言語モデル(LLM)は人間レベルのテキスト生成を実現し、効果的なAI生成テキスト検出の必要性を強調している。我々は、異なるLLMによって生成される多様な人文やテキストからテキストを収集することで、包括的なテストベッドを構築する。問題にもかかわらず、トップパフォーマンス検出器は、新しいLCMによって生成された86.54%のドメイン外のテキストを識別することができ、アプリケーションシナリオの実現可能性を示している。
論文参考訳（メタデータ） (2023-05-22T17:13:29Z)
On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。 GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文参考訳（メタデータ） (2023-04-10T17:47:39Z)
Can AI-Generated Text be Reliably Detected? [50.95804851595018]
大規模言語モデル(LLM)は、様々なアプリケーションで非常によく機能します。盗作、偽ニュースの発生、スパムなどの活動においてこれらのモデルが誤用される可能性があることは、彼らの責任ある使用に対する懸念を引き起こしている。我々は、攻撃者の存在下で、これらのAIテキスト検出装置の堅牢性を強調テストする。
論文参考訳（メタデータ） (2023-03-17T17:53:19Z)
The Role of AI in Drug Discovery: Challenges, Opportunities, and Strategies [97.5153823429076]
この分野でのAIのメリット、課題、欠点についてレビューする。データ拡張、説明可能なAIの使用、従来の実験手法とAIの統合についても論じている。
論文参考訳（メタデータ） (2022-12-08T23:23:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。