論文の概要: LOKI: Proactively Discovering Online Scam Websites by Mining Toxic Search Queries
- arxiv url: http://arxiv.org/abs/2509.12181v1
- Date: Mon, 15 Sep 2025 17:44:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.435358
- Title: LOKI: Proactively Discovering Online Scam Websites by Mining Toxic Search Queries
- Title(参考訳): LOKI: 有害検索クエリをマイニングしてオンライン詐欺サイトを積極的に発見
- Authors: Pujan Paudel, Gianluca Stringhini,
- Abstract要約: 本稿では,検索エンジンのクエリを識別するシステムであるLOKIについて紹介する。
我々は、LOKIを10の主要詐欺カテゴリで厳格に検証し、発見の20.58倍の改善を実証した。
LOKIは、未確認の詐欺カテゴリに一般化し、新興の脅威に直面するその実用性を浮き彫りにしている。
- 参考スコア(独自算出の注目度): 11.479111172495408
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online e-commerce scams, ranging from shopping scams to pet scams, globally cause millions of dollars in financial damage every year. In response, the security community has developed highly accurate detection systems able to determine if a website is fraudulent. However, finding candidate scam websites that can be passed as input to these downstream detection systems is challenging: relying on user reports is inherently reactive and slow, and proactive systems issuing search engine queries to return candidate websites suffer from low coverage and do not generalize to new scam types. In this paper, we present LOKI, a system designed to identify search engine queries likely to return a high fraction of fraudulent websites. LOKI implements a keyword scoring model grounded in Learning Under Privileged Information (LUPI) and feature distillation from Search Engine Result Pages (SERPs). We rigorously validate LOKI across 10 major scam categories and demonstrate a 20.58 times improvement in discovery over both heuristic and data-driven baselines across all categories. Leveraging a small seed set of only 1,663 known scam sites, we use the keywords identified by our method to discover 52,493 previously unreported scams in the wild. Finally, we show that LOKI generalizes to previously-unseen scam categories, highlighting its utility in surfacing emerging threats.
- Abstract(参考訳): オンラインのeコマース詐欺は、ショッピング詐欺からペット詐欺まで、毎年何百万ドルもの金銭的損害をもたらしている。
これに対し、セキュリティコミュニティはウェブサイトが不正であるかどうかを判断できる高精度な検知システムを開発した。
しかし、これらの下流検出システムへの入力として通過可能な候補詐欺サイトを見つけることは困難であり、ユーザレポートへの依存は本質的に反応性が高く、遅い。
本稿では,検索エンジンのクエリを識別するシステムであるLOKIについて述べる。
LOKIは、Learning Under Privileged Information (LUPI) と Search Engine Result Pages (SERP) の機能蒸留を基盤としたキーワードスコアリングモデルを実装している。
我々は、LOKIを10の主要詐欺カテゴリで厳格に検証し、すべてのカテゴリでヒューリスティックとデータ駆動のベースラインを20.58倍に改善したことを実証した。
これまでに報告されていない52,493個の詐欺の発見には,わずか1,663個の詐欺サイトからなる小さなシードセットを用いる。
最後に、LOKIは、未確認の詐欺カテゴリに一般化し、新興の脅威に直面するその実用性を浮き彫りにしている。
関連論文リスト
- Send to which account? Evaluation of an LLM-based Scambaiting System [0.0]
本稿では,大規模言語モデル(LLM)を用いたスカンバイティングシステムの大規模実世界評価について述べる。
5ヶ月にわたるデプロイメントで、システムは実際のスキャマーと2,600以上のエンゲージメントを開始し、18,700以上のメッセージのデータセットを作成した。
情報開示率(IDR)は約32%に達し、ラバ口座などの機密情報を抽出することに成功している。
論文 参考訳(メタデータ) (2025-09-10T11:08:52Z) - ScamFerret: Detecting Scam Websites Autonomously with Large Language Models [2.6217304977339473]
ScamFerretは、大きな言語モデル(LLM)を使用して、特定のURLからデータを自律的に収集して分析し、それが詐欺であるかどうかを判断する革新的なエージェントシステムである。
評価の結果、ScamFerretは英語で4つの詐欺タイプを分類する0.972の精度と、オンラインショッピングサイトを3つの言語で分類する0.993の精度を達成できた。
論文 参考訳(メタデータ) (2025-02-14T12:16:38Z) - Exposing LLM Vulnerabilities: Adversarial Scam Detection and Performance [16.9071617169937]
本稿では, 大規模言語モデル (LLM) の脆弱性を, 詐欺検出のタスクに対して対向詐欺メッセージに直面する際の脆弱性について検討する。
我々は、オリジナルメッセージと逆詐欺メッセージの両方を含む、きめ細かいスカムメッセージのラベル付き包括的なデータセットを作成しました。
分析の結果, LLMの脆弱性を利用した逆例は, 高い誤分類率をもたらすことがわかった。
論文 参考訳(メタデータ) (2024-12-01T00:13:28Z) - Evaluating Robustness of Generative Search Engine on Adversarial Factual Questions [89.35345649303451]
生成検索エンジンは、人々がオンラインで情報を求める方法を変える可能性を秘めている。
しかし,既存の大規模言語モデル(LLM)が支援する生成検索エンジンからの応答は必ずしも正確ではない。
検索強化世代は、敵がシステム全体を回避できるため、安全上の懸念を増す。
論文 参考訳(メタデータ) (2024-02-25T11:22:19Z) - Detecting Scams Using Large Language Models [19.7220607313348]
大規模言語モデル(LLM)は、セキュリティなど、様々なアプリケーションで注目を集めている。
本稿では,サイバーセキュリティの重要な側面である詐欺検知におけるLCMの有用性について検討する。
フィッシング、前払い詐欺、ロマンス詐欺などの詐欺を識別するためのLLMの新しいユースケースを提案する。
論文 参考訳(メタデータ) (2024-02-05T16:13:54Z) - User Attitudes to Content Moderation in Web Search [49.1574468325115]
我々は、Web検索における誤解を招く可能性のあるコンテンツや攻撃的なコンテンツに適用される様々なモデレーションプラクティスに対するサポートレベルについて検討する。
最も支持されている実践は、誤解を招く可能性のあるコンテンツや不快なコンテンツについてユーザーに知らせることであり、最も支持されていないものは、検索結果を完全に削除することである。
より保守的なユーザーやウェブ検索結果に対する信頼度が低いユーザーは、ウェブ検索におけるコンテンツモデレーションに反する傾向にある。
論文 参考訳(メタデータ) (2023-10-05T10:57:15Z) - Evaluating Verifiability in Generative Search Engines [70.59477647085387]
生成検索エンジンは、インラインの引用とともに、ユーザークエリへの応答を直接生成する。
我々は,一般的な4つの生成検索エンジンの評価を行う。
既存の生成検索エンジンからの応答は流動的であり、情報的に見えるが、しばしばサポートされていない文や不正確な引用を含んでいる。
論文 参考訳(メタデータ) (2023-04-19T17:56:12Z) - Tainted Love: A Systematic Review of Online Romance Fraud [68.8204255655161]
ロマンス詐欺は、オンラインデートプラットフォーム上でのロマンチックな関係をサイバー犯罪者が構築することを含む。
我々は,ロマンス詐欺の文学的景観を特徴づけ,研究者や実践者の理解を深める。
主な貢献は, ロマンス詐欺のプロファイル, ロマンス詐欺の緩和対策, 詐欺師や被害者となることを前提とした要因の3つであった。
論文 参考訳(メタデータ) (2023-02-28T20:34:07Z) - Recent trends in Social Engineering Scams and Case study of Gift Card
Scam [4.345672405192058]
社会工学詐欺(SES)は、人類による電気通信の導入以来、存在してきた。
世界中の無実の人々をターゲットにした、様々なソーシャルエンジニアリング詐欺の最近の動向。
各種企業顧客を対象としたリアルタイムギフトカード詐欺の事例研究
論文 参考訳(メタデータ) (2021-10-13T04:17:02Z) - DFraud3- Multi-Component Fraud Detection freeof Cold-start [50.779498955162644]
コールドスタート(Cold-start)は、新しいユーザの認証に検出システムが失敗したことを指す重要な問題である。
本稿では,各コンポーネントに固有の表現を可能にする異種情報ネットワーク (HIN) としてレビューシステムをモデル化する。
HINとグラフ誘導はカモフラージュ問題(本物のレビュー付き詐欺師)に対処するのに役立ち、これはコールドスタートと組み合わされた場合、すなわち真に最初のレビューを持つ新しい詐欺師がより深刻であることが示されている。
論文 参考訳(メタデータ) (2020-06-10T08:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。