論文の概要: Prompt-Induced Linguistic Fingerprints for LLM-Generated Fake News Detection
- arxiv url: http://arxiv.org/abs/2508.12632v1
- Date: Mon, 18 Aug 2025 05:24:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.979109
- Title: Prompt-Induced Linguistic Fingerprints for LLM-Generated Fake News Detection
- Title(参考訳): LLM生成フェイクニュース検出のためのプロンプト誘起言語的フィンガープリント
- Authors: Chi Wang, Min Gao, Zongwei Wang, Junwei Yin, Kai Shu, Chenghua Lin,
- Abstract要約: 言語的フィンガープリント抽出法(LIFE)を提案する。
単語レベルの確率分布を再構成することにより、LIFEはLLM生成フェイクニュースの検出を容易にする識別パターンを見つけることができる。
実験の結果, LIFE は LLM 生成フェイクニュースにおける最先端のパフォーマンスを達成し, 人手によるフェイクニュースにおけるハイパフォーマンスを維持していることがわかった。
- 参考スコア(独自算出の注目度): 35.51961877931122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid development of large language models, the generation of fake news has become increasingly effortless, posing a growing societal threat and underscoring the urgent need for reliable detection methods. Early efforts to identify LLM-generated fake news have predominantly focused on the textual content itself; however, because much of that content may appear coherent and factually consistent, the subtle traces of falsification are often difficult to uncover. Through distributional divergence analysis, we uncover prompt-induced linguistic fingerprints: statistically distinct probability shifts between LLM-generated real and fake news when maliciously prompted. Based on this insight, we propose a novel method named Linguistic Fingerprints Extraction (LIFE). By reconstructing word-level probability distributions, LIFE can find discriminative patterns that facilitate the detection of LLM-generated fake news. To further amplify these fingerprint patterns, we also leverage key-fragment techniques that accentuate subtle linguistic differences, thereby improving detection reliability. Our experiments show that LIFE achieves state-of-the-art performance in LLM-generated fake news and maintains high performance in human-written fake news. The code and data are available at https://anonymous.4open.science/r/LIFE-E86A.
- Abstract(参考訳): 大規模言語モデルの急速な発展に伴い、偽ニュースの発生はますます困難になり、社会的脅威が増大し、信頼性のある検出方法の緊急の必要性が強調されている。
LLMが生成した偽ニュースを識別する初期の試みは、主にテキストの内容そのものに焦点を合わせてきたが、その内容の多くは一貫性があり、現実的に一貫性があるように見えるため、偽ニュースの微妙な痕跡を明らかにすることはしばしば困難である。
分布のばらつき分析により,LLMが生成した実ニュースと偽ニュースの統計的に異なる確率変化が引き起こされた。
そこで本研究では,言語的フィンガープリント抽出法(LIFE)を提案する。
単語レベルの確率分布を再構成することにより、LIFEはLLM生成フェイクニュースの検出を容易にする識別パターンを見つけることができる。
これらの指紋パターンをさらに増幅するために、微妙な言語的差異を強調させるキーフラグメント技術を活用し、検出信頼性を向上させる。
実験の結果, LIFE は LLM 生成フェイクニュースにおける最先端のパフォーマンスを達成し, 人手によるフェイクニュースにおけるハイパフォーマンスを維持していることがわかった。
コードとデータはhttps://anonymous.4open.science/r/LIFE-E86Aで公開されている。
関連論文リスト
- LLM-GAN: Construct Generative Adversarial Network Through Large Language Models For Explainable Fake News Detection [34.984605500444324]
大規模言語モデル(LLM)は、その強力な自然言語理解と説明生成能力で知られている。
LLMをジェネレータとインタクタにするためのプロンプト機構を利用した新しいフレームワーク LLM-GAN を提案する。
本結果は,LLM-GANが予測性能と説明品質の両方において有効であることを示す。
論文 参考訳(メタデータ) (2024-09-03T11:06:45Z) - Dynamic Analysis and Adaptive Discriminator for Fake News Detection [59.41431561403343]
偽ニュース検出のための動的解析・適応識別器(DAAD)手法を提案する。
知識に基づく手法では,モンテカルロ木探索アルゴリズムを導入し,大規模言語モデルの自己表現能力を活用する。
意味に基づく手法では、偽ニュース生成のメカニズムを明らかにするために、典型的偽造パターンを4つ定義する。
論文 参考訳(メタデータ) (2024-08-20T14:13:54Z) - Exploring the Deceptive Power of LLM-Generated Fake News: A Study of Real-World Detection Challenges [21.425647152424585]
条件付き変分オートエンコーダライズプロンプト(VLPrompt)と呼ばれる強力なフェイクニュース攻撃手法を提案する。
現行のメソッドとは異なり、VLPromptはコンテキストコヒーレンスを維持しながら追加のデータ収集を不要にする。
さまざまな検出方法や新しい人間の研究指標を含む実験を行い,その性能をデータセット上で評価した。
論文 参考訳(メタデータ) (2024-03-27T04:39:18Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Fake News in Sheep's Clothing: Robust Fake News Detection Against LLM-Empowered Style Attacks [60.14025705964573]
SheepDogは、ニュースの正確性を決定する際に、スタイルよりもコンテンツを優先する、スタイルに反する偽ニュース検出ツールだ。
SheepDog はこのレジリエンスを,(1) LLM を利用したニュースリフレーミング,(2) 異なるスタイルに対応する記事のカスタマイズによる学習プロセスへのスタイル多様性の注入,(2) スタイルの異なるリフレーミング間で一貫した妥当性予測を保証するスタイル非依存のトレーニング,(3) LLM からコンテンツ中心のガイドラインを抽出して偽ニュースを抽出するコンテンツ中心の属性を通じて達成する。
論文 参考訳(メタデータ) (2023-10-16T21:05:12Z) - Fake News Detectors are Biased against Texts Generated by Large Language
Models [39.36284616311687]
フェイクニュースの拡散は、信頼を弱め、社会への脅威を訴える重要な課題として浮上している。
本稿では,人間の書き起こしとLLM生成の両方の誤情報を含むシナリオにおいて,偽ニュース検知器を評価するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-09-15T18:04:40Z) - MAGE: Machine-generated Text Detection in the Wild [82.70561073277801]
大規模言語モデル(LLM)は人間レベルのテキスト生成を実現し、効果的なAI生成テキスト検出の必要性を強調している。
我々は、異なるLLMによって生成される多様な人文やテキストからテキストを収集することで、包括的なテストベッドを構築する。
問題にもかかわらず、トップパフォーマンス検出器は、新しいLCMによって生成された86.54%のドメイン外のテキストを識別することができ、アプリケーションシナリオの実現可能性を示している。
論文 参考訳(メタデータ) (2023-05-22T17:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。