Fugu-MT 論文翻訳(概要): Can LLM-Generated Misinformation Be Detected?

論文の概要: Can LLM-Generated Misinformation Be Detected?

arxiv url: http://arxiv.org/abs/2309.13788v2
Date: Tue, 12 Dec 2023 17:35:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-13 19:44:04.243920
Title: Can LLM-Generated Misinformation Be Detected?
Title（参考訳）: LLMによる誤報検出は可能か?
Authors: Canyu Chen, Kai Shu
Abstract要約: 大型言語モデル(LLM)は誤情報を生成するために利用することができる。 LLMが生成した誤報は、人間が書いた誤報よりも有害か?
参考スコア（独自算出の注目度）: 21.712051537924136
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The advent of Large Language Models (LLMs) has made a transformative impact. However, the potential that LLMs such as ChatGPT can be exploited to generate misinformation has posed a serious concern to online safety and public trust. A fundamental research question is: will LLM-generated misinformation cause more harm than human-written misinformation? We propose to tackle this question from the perspective of detection difficulty. We first build a taxonomy of LLM-generated misinformation. Then we categorize and validate the potential real-world methods for generating misinformation with LLMs. Then, through extensive empirical investigation, we discover that LLM-generated misinformation can be harder to detect for humans and detectors compared to human-written misinformation with the same semantics, which suggests it can have more deceptive styles and potentially cause more harm. We also discuss the implications of our discovery on combating misinformation in the age of LLMs and the countermeasures.
Abstract（参考訳）: 大規模言語モデル(llm)の出現は、変革的な影響をもたらした。しかし、chatgptのようなllmを悪用して誤った情報を生成する可能性は、オンラインの安全と公共の信頼に深刻な懸念をもたらしている。 LLMが生成した誤報は、人間が書いた誤報よりも有害か? 我々は,検出難易度の観点からこの問題に取り組むことを提案する。まず LLM 生成の誤情報を分類する。次に,LLMを用いた誤情報生成手法の分類と検証を行った。そこで,本研究では,llmが生成した誤情報を人間や検出者に対して,同じ意味を持つ人間の誤情報と比較して検出することが困難であることを示す。また,llm時代の誤情報対策における発見の意義と対策について考察する。

関連論文リスト

Large Language Model Hacking: Quantifying the Hidden Risks of Using LLMs for Text Annotation [66.84286617519258]
大規模言語モデルは、データアノテーションやテキスト分析といった労働集約的なタスクの自動化を可能にすることで、社会科学の研究を変革している。このような変異は、系統的なバイアスやランダムなエラーを導入し、下流の分析に伝播し、タイプI(偽陽性)、タイプII(偽陰性)、タイプS(重み付け効果)、タイプM(誇張効果)のエラーを引き起こす。意図的なLSMハッキングは驚くほど単純であることがわかった。21の社会科学研究から37のデータアノテーションタスクを複製することで、ほんのわずかのプロンプトの言い回しで、事実上何であれ統計的に重要なものとして表現できることがわかりました。
論文参考訳（メタデータ） (2025-09-10T17:58:53Z)
An Audit and Analysis of LLM-Assisted Health Misinformation Jailbreaks Against LLMs [5.0015751459745825]
大規模言語モデル(LLM)は有害な誤報を発生させる能力がある -- 必然的に、あるいは悪意のあるアウトプットを発生させようとする"ジェイルブレイク"攻撃によって引き起こされる場合。本稿では,他のモデルが有害な医療的誤報を発生させるようなLDMによるジェイルブレイク攻撃の有効性と特徴について検討する。また,脱獄したLLMが生成した誤情報とソーシャルメディア上の典型的な誤情報とを比較検討した。
論文参考訳（メタデータ） (2025-08-06T02:14:28Z)
How does Misinformation Affect Large Language Model Behaviors and Preferences? [37.06385727015972]
大きな言語モデル(LLM)は、知識集約的なタスクにおいて顕著な能力を示している。我々は,LLMの行動と誤情報に対する知識嗜好を評価するための,現在最大かつ最も包括的なベンチマークであるMisBenchを紹介する。実証的な結果から、LLMは誤報を識別する能力に匹敵する能力を示すが、知識の衝突やスタイルのバリエーションの影響を受けやすいままであることが明らかとなった。
論文参考訳（メタデータ） (2025-05-27T17:57:44Z)
How to Protect Yourself from 5G Radiation? Investigating LLM Responses to Implicit Misinformation [24.355564722047244]
大規模言語モデル(LLM)は多様なシナリオに広くデプロイされている。彼らが誤報をうまく広める程度は、重大な安全上の懸念として浮かび上がっている。暗黙的誤報の最初のベンチマークであるECHOMISTをキュレートした。
論文参考訳（メタデータ） (2025-03-12T17:59:18Z)
Should You Use Your Large Language Model to Explore or Exploit? [55.562545113247666]
探索・探索トレードオフに直面した意思決定エージェントを支援するために,大規模言語モデルの能力を評価する。現在のLLMは、しばしば利用に苦労するが、小規模タスクのパフォーマンスを大幅に改善するために、コンテキスト内緩和が用いられる可能性がある。
論文参考訳（メタデータ） (2025-01-31T23:42:53Z)
LLM Echo Chamber: personalized and automated disinformation [0.0]
大規模な言語モデルは、説得力のある人間のような誤報を大規模に広めることができ、世論に影響を及ぼす可能性がある。本研究は,誤報を事実として伝達するLSMの能力に着目し,これらのリスクについて検討する。そこで我々は,ソーシャルメディアのチャットルームを模擬した制御型デジタル環境であるLLM Echo Chamberを構築した。このセットアップは、説得性と有害性のためにGPT4によって評価され、LSMを取り巻く倫理的懸念に光を当て、誤情報に対するより強力な保護の必要性を強調している。
論文参考訳（メタデータ） (2024-09-24T17:04:12Z)
Can Editing LLMs Inject Harm? [122.83469484328465]
我々は,大規模言語モデルに対する新しいタイプの安全脅威として,知識編集を再構築することを提案する。誤情報注入の危険性については,まずコモンセンス誤情報注入とロングテール誤情報注入に分類する。偏見注入のリスクに対して, 偏見文をLLMに高効率で注入できるだけでなく, 1つの偏見文注入で偏見が増大することを発見した。
論文参考訳（メタデータ） (2024-07-29T17:58:06Z)
LEMMA: Towards LVLM-Enhanced Multimodal Misinformation Detection with External Knowledge Augmentation [58.524237916836164]
外部知識を付加したLVLM強化マルチモーダル誤報検出システム LEMMAを提案する。提案手法は,Twitter と Fakeddit のデータセットにおいて,上位ベースライン LVLM の精度を 7% と 13% に向上させる。
論文参考訳（メタデータ） (2024-02-19T08:32:27Z)
When Do LLMs Need Retrieval Augmentation? Mitigating LLMs' Overconfidence Helps Retrieval Augmentation [66.01754585188739]
大規模言語モデル(LLM)は、特定の知識を持っていないことを知るのが困難であることが判明した。 Retrieval Augmentation (RA)はLLMの幻覚を緩和するために広く研究されている。本稿では,LLMの知識境界に対する認識を高めるためのいくつかの手法を提案する。
論文参考訳（メタデータ） (2024-02-18T04:57:19Z)
Disinformation Capabilities of Large Language Models [0.564232659769944]
本稿では,現在世代の大言語モデル(LLM)の非情報化能力について述べる。 20個の偽情報物語を用いた10個のLDMの能力評価を行った。 LLMは、危険な偽情報の物語に一致する説得力のあるニュース記事を生成することができると結論付けている。
論文参考訳（メタデータ） (2023-11-15T10:25:30Z)
RECALL: A Benchmark for LLMs Robustness against External Counterfactual Knowledge [69.79676144482792]
本研究の目的は,LLMが外部知識から信頼できる情報を識別する能力を評価することである。本ベンチマークは,質問応答とテキスト生成という2つのタスクから構成される。
論文参考訳（メタデータ） (2023-11-14T13:24:19Z)
Combating Misinformation in the Age of LLMs: Opportunities and Challenges [21.712051537924136]
LLM(Large Language Models)の出現は、誤情報と戦う環境を再構築する大きな可能性を秘めている。一方、LLMは、その深い世界知識と強力な推論能力のために、誤情報と戦うための有望な機会をもたらす。一方,LLMは大規模に誤情報を生成するために容易に活用できるという点が重要な課題である。
論文参考訳（メタデータ） (2023-11-09T00:05:27Z)
Disinformation Detection: An Evolving Challenge in the Age of LLMs [16.46484369516341]
大きな言語モデル(LLM)は、説得力が高く、誤解を招くコンテンツを生成する。 LLMは、先進的な偽情報に対する堅牢な防御として利用することができる。偽情報の形成と検出を総合的に探究し、この研究を育成する。
論文参考訳（メタデータ） (2023-09-25T22:12:50Z)
Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation [109.8527403904657]
大規模言語モデル(LLM)は,その知識に対する信頼度が低く,内部知識と外部知識の衝突をうまく扱えないことを示す。検索の強化は、LLMの知識境界に対する認識を高める効果的なアプローチであることが証明されている。本稿では,文書を動的に活用するための簡易な手法を提案する。
論文参考訳（メタデータ） (2023-07-20T16:46:10Z)
On the Risk of Misinformation Pollution with Large Language Models [127.1107824751703]
本稿では,現代大規模言語モデル (LLM) の誤用の可能性について検討する。本研究は, LLMが効果的な誤情報発生器として機能し, DOQAシステムの性能が著しく低下することを明らかにする。
論文参考訳（メタデータ） (2023-05-23T04:10:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。