Fugu-MT 論文翻訳(概要): Large Language Models Can Be Used To Effectively Scale Spear Phishing Campaigns

論文の概要: Large Language Models Can Be Used To Effectively Scale Spear Phishing Campaigns

arxiv url: http://arxiv.org/abs/2305.06972v1
Date: Thu, 11 May 2023 16:55:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-12 13:55:25.116141
Title: Large Language Models Can Be Used To Effectively Scale Spear Phishing Campaigns
Title（参考訳）: 大きな言語モデルを使って、槍フィッシングキャンペーンを効果的にスケールできる
Authors: Julian Hazell
Abstract要約: 本研究では,スピアフィッシングにおける大規模言語モデルの有用性について検討した。私はOpenAIのGPT-3.5とGPT-4モデルを使って600人以上の英国議会議員に対してスピアフィッシングメッセージを作成します。私の発見によると、これらのメッセージは現実的なものばかりでなく、非常に費用効果が高い。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent progress in artificial intelligence (AI), particularly in the domain of large language models (LLMs), has resulted in powerful and versatile dual-use systems. Indeed, cognition can be put towards a wide variety of tasks, some of which can result in harm. This study investigates how LLMs can be used for spear phishing, a prevalent form of cybercrime that involves manipulating targets into divulging sensitive information. I first explore LLMs' ability to assist with the reconnaissance and message generation stages of a successful spear phishing attack, where I find that advanced LLMs are capable of meaningfully improving cybercriminals' efficiency during these stages. Next, I conduct an empirical test by creating unique spear phishing messages for over 600 British Members of Parliament using OpenAI's GPT-3.5 and GPT-4 models. My findings reveal that these messages are not only realistic but also remarkably cost-effective, as each email cost only a fraction of a cent to generate. Next, I demonstrate how basic prompt engineering can circumvent safeguards installed in LLMs by the reinforcement learning from human feedback fine-tuning process, highlighting the need for more robust governance interventions aimed at mitigating misuse. To address these evolving risks, I propose two potential solutions: structured access schemes, such as application programming interfaces, and LLM-based defensive systems.
Abstract（参考訳）: 人工知能(AI)の最近の進歩、特に大規模言語モデル(LLM)の領域は、強力で汎用的なデュアルユースシステムを生み出している。実際、認知は様々なタスクに向けられ、そのうちのいくつかは害をもたらす可能性がある。本研究は、標的を操り機密情報を漏らすことを含む、一般的なサイバー犯罪である槍フィッシング(spier phishing)に、llmをいかに使用できるかを調査した。先進的なLSMがサイバー犯罪の効率を有意義に向上させることができることが分かり、私はまず、スピアフィッシング攻撃の成功に対する偵察およびメッセージ生成の段階を支援するLLMの能力について検討した。次に,OpenAI の GPT-3.5 および GPT-4 モデルを用いて,600 人以上の英国議会議員に対して,ユニークなスピアフィッシングメッセージを作成することにより,実証実験を行った。私の発見によると、これらのメッセージは現実的だけでなく、コスト効率も著しく高く、それぞれのメールは生成にわずか1セントしかかからない。次に、人間のフィードバックによる微調整プロセスからの強化学習により、LLMにインストールされた安全ガードを回避するための基本的なプロンプトエンジニアリングを実証し、誤用を緩和するためのより堅牢なガバナンス介入の必要性を強調します。この進化するリスクに対処するために、アプリケーションプログラミングインタフェースのような構造化アクセススキームとLLMベースの防御システムという2つの潜在的解決策を提案する。

関連論文リスト

Phishing Email Detection Using Large Language Models [4.751410425426722]
電子メールフィッシング(Email phishing)は、サイバー侵入の最も一般的かつ世界規模で起こるベクトルの1つである。現在のLarge Language Models (LLM) は、電子メールのセキュリティシステムにデプロイする前に大幅に強化する必要がある。本稿では,複数の攻撃ベクトルにわたるフィッシングメール攻撃を検出するLLMベースのフレームワークであるLLMPEAを提案する。
論文参考訳（メタデータ） (2025-12-10T21:50:52Z)
Large Language Model Hacking: Quantifying the Hidden Risks of Using LLMs for Text Annotation [66.84286617519258]
大規模言語モデルは、データアノテーションやテキスト分析といった労働集約的なタスクの自動化を可能にすることで、社会科学の研究を変革している。このような変異は、系統的なバイアスやランダムなエラーを導入し、下流の分析に伝播し、タイプI(偽陽性)、タイプII(偽陰性)、タイプS(重み付け効果)、タイプM(誇張効果)のエラーを引き起こす。意図的なLSMハッキングは驚くほど単純であることがわかった。21の社会科学研究から37のデータアノテーションタスクを複製することで、ほんのわずかのプロンプトの言い回しで、事実上何であれ統計的に重要なものとして表現できることがわかりました。
論文参考訳（メタデータ） (2025-09-10T17:58:53Z)
Paladin: Defending LLM-enabled Phishing Emails with a New Trigger-Tag Paradigm [26.399199616508596]
悪意のあるユーザは、スペルミスなどの簡単に検出可能な機能のないフィッシングメールを合成することができる。このようなモデルはトピック固有のフィッシングメッセージを生成し、ターゲットドメインにコンテンツを調整することができる。既存の意味レベル検出アプローチのほとんどは、それらを確実に識別するのに苦労している。本稿では,様々な挿入戦略を用いてトリガータグ関連をバニラLSMに埋め込むパラジンを提案する。計測されたLLMがフィッシングに関連するコンテンツを生成すると、検出可能なタグが自動的に含まれ、識別が容易になる。
論文参考訳（メタデータ） (2025-09-08T23:44:00Z)
LLM-Powered Intent-Based Categorization of Phishing Emails [0.0]
本稿では,Large Language Models (LLMs) の実践的可能性について検討し,その意図に焦点をあててフィッシングメールを検出する。 LLMによって運用されている意図型分類を導入し、メールを異なるカテゴリに分類し、行動可能な脅威情報を生成する。以上の結果から,既存のLCMではフィッシングメールの検出と分類が可能であることが示唆された。
論文参考訳（メタデータ） (2025-06-17T09:21:55Z)
LLMs unlock new paths to monetizing exploits [85.60539289753564]
大規模言語モデル(LLM)はすぐにサイバー攻撃の経済性を変えるだろう。 LLMは、敵がユーザーごとにカスタマイズされた攻撃を起動することを可能にする。
論文参考訳（メタデータ） (2025-05-16T17:05:25Z)
SpearBot: Leveraging Large Language Models in a Generative-Critique Framework for Spear-Phishing Email Generation [9.322176274376774]
大規模言語モデル(LLM)は、コンテンツ生成などのタスクを支援する能力が増している。本稿では,スピアフィッシングメールを生成するための敵対的フレームワークであるSpearBotを提案する。
論文参考訳（メタデータ） (2024-12-15T08:13:12Z)
Next-Generation Phishing: How LLM Agents Empower Cyber Attackers [10.067883724547182]
フィッシングメールのエスカレートする脅威は、Large Language Models(LLMs)の台頭により、ますます洗練されつつある。攻撃者はLSMを利用して、より説得力があり回避的なフィッシングメールを作成するため、現在のフィッシング防御のレジリエンスを評価することが不可欠である。我々は、Gmail Spam Filter、Apache SpamAssassin、Proofpointなどの従来のフィッシング検出と、SVM、Logistic Regression、Naive Bayesといった機械学習モデルに関する包括的な評価を行います。以上の結果から,全検知器にまたがるリフレッシュメールの検出精度は著しく低下し,現在のフィッシング防御における重大な弱点が浮き彫りになった。
論文参考訳（メタデータ） (2024-11-21T06:20:29Z)
Aligning LLMs to Be Robust Against Prompt Injection [55.07562650579068]
インジェクション攻撃に対してLCMをより堅牢にするための強力なツールとしてアライメントが有効であることを示す。私たちのメソッド -- SecAlign -- は、最初に、プロンプトインジェクション攻撃をシミュレートしてアライメントデータセットを構築します。実験の結果,SecAlign は LLM を大幅に強化し,モデルの実用性に悪影響を及ぼすことが示された。
論文参考訳（メタデータ） (2024-10-07T19:34:35Z)
MEGen: Generative Backdoor in Large Language Models via Model Editing [56.46183024683885]
大規模言語モデル(LLM)は目覚ましい能力を示している。その強力な生成能力は、様々なクエリや命令に基づいて柔軟な応答を可能にする。本稿では,最小サイドエフェクトでNLPタスクをカスタマイズしたバックドアを構築することを目的とした,MEGenという編集ベースの生成バックドアを提案する。
論文参考訳（メタデータ） (2024-08-20T10:44:29Z)
Evaluating LLM-based Personal Information Extraction and Countermeasures [63.91918057570824]
大規模言語モデル(LLM)に基づく個人情報抽出をベンチマークすることができる。 LLMは攻撃者によって誤用され、個人プロファイルから様々な個人情報を正確に抽出する。プロンプトインジェクションは強力なLDMベースの攻撃に対して防御し、攻撃をより効果的でない従来の攻撃に還元する。
論文参考訳（メタデータ） (2024-08-14T04:49:30Z)
Coercing LLMs to do and reveal (almost) anything [80.8601180293558]
大規模言語モデル(LLM)に対する敵対的攻撃は、有害なステートメントを作るためにモデルを「ジェイルブレイク」することができることが示されている。 LLMに対する敵対的攻撃のスペクトルは単なるジェイルブレイクよりもはるかに大きいと我々は主張する。
論文参考訳（メタデータ） (2024-02-21T18:59:13Z)
Large Language Model Lateral Spear Phishing: A Comparative Study in Large-Scale Organizational Settings [3.251318035773221]
本研究では,Large Language Models (LLMs) を用いた横型フィッシングメール作成の先駆的な研究である。 11ヶ月の期間に約9000人の個人を対象とする大規模な第1階層の大学運営を目標としている。また、LLM生成したフィッシングを検知する電子メールフィルタリングインフラの能力も評価した。
論文参考訳（メタデータ） (2024-01-18T05:06:39Z)
From Chatbots to PhishBots? -- Preventing Phishing scams created using ChatGPT, Google Bard and Claude [3.7741995290294943]
本研究では,一般的な4つの大規模言語モデルを用いてフィッシング攻撃を発生させる可能性について検討する。我々は、悪意のあるプロンプトの早期検出に使用できるBERTベースの自動検出ツールを構築した。我々のモデルは4つの商用LCM間で転送可能であり、フィッシングサイトプロンプトの平均精度は96%、フィッシングメールプロンプトの平均精度は94%である。
論文参考訳（メタデータ） (2023-10-29T22:52:40Z)
SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks [99.23352758320945]
SmoothLLMは,大規模言語モデル(LLM)に対するジェイルブレーキング攻撃を軽減するために設計された,最初のアルゴリズムである。敵が生成したプロンプトが文字レベルの変化に対して脆弱であることから、我々の防衛はまず、与えられた入力プロンプトの複数のコピーをランダムに摂動し、対応する予測を集約し、敵の入力を検出する。
論文参考訳（メタデータ） (2023-10-05T17:01:53Z)
Detecting Phishing Sites Using ChatGPT [2.3999111269325266]
本稿では,大規模言語モデル(LLM)を用いてフィッシングサイトを検出するChatPhishDetectorという新しいシステムを提案する。本システムでは,Webクローラを利用してWebサイトから情報を収集し,クローリングデータに基づいてLLMのプロンプトを生成し,LLMが生成した応答から検出結果を取得する。 GPT-4Vを用いた実験結果は、98.7%の精度と99.6%のリコールで優れた性能を示し、他のLLMや既存のシステムよりも優れていた。
論文参考訳（メタデータ） (2023-06-09T11:30:08Z)
Not what you've signed up for: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection [64.67495502772866]
大規模言語モデル(LLM)は、様々なアプリケーションに統合されつつある。本稿では、プロンプトインジェクション攻撃を用いて、攻撃者が元の命令をオーバーライドし、制御を採用する方法を示す。我々は、コンピュータセキュリティの観点から、影響や脆弱性を体系的に調査する包括的な分類法を導出する。
論文参考訳（メタデータ） (2023-02-23T17:14:38Z)
Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks [67.86285142381644]
命令追従型大規模言語モデルの最近の進歩は、悪意のある目的のために二重使用リスクを増幅する。命令追従機能がコンピュータセキュリティの標準的な攻撃を可能にするため、デュアルユースを防ぐのは難しい。本研究では,LLMがヘイトスピーチや詐欺などの悪意のあるコンテンツをターゲットにすることができることを示す。
論文参考訳（メタデータ） (2023-02-11T15:57:44Z)
Targeted Phishing Campaigns using Large Scale Language Models [0.0]
フィッシングメール(英: Phishing email)とは、個人を騙して機密情報を明らかにしたり、攻撃者に利益をもたらす行動を起こさせる不正なメッセージである。生成したテキストの品質など,様々な基準に基づき,これらの電子メールを生成する際のNLMの性能を評価するためのフレームワークを提案する。評価の結果,NLMは個人を騙すのが難しいフィッシングメールを生成することができるが,その有効性は特定のNLMとトレーニングデータに基づいて異なることがわかった。
論文参考訳（メタデータ） (2022-12-30T03:18:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。