論文の概要: DomainHarvester: Harvesting Infrequently Visited Yet Trustworthy Domain Names
- arxiv url: http://arxiv.org/abs/2410.02097v1
- Date: Fri, 18 Oct 2024 02:56:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 08:55:37.039675
- Title: DomainHarvester: Harvesting Infrequently Visited Yet Trustworthy Domain Names
- Title(参考訳): DomainHarvester: 頻繁に訪れるが信頼できるドメイン名
- Authors: Daiki Chiba, Hiroki Nakano, Takashi Koide,
- Abstract要約: 本稿では、信頼に値するが頻繁に訪れるドメインを含む許容リストを生成するシステムであるDomainHarvesterを紹介する。
このシステムはシードURLを使ってドメイン名を収集し、Transformerベースのアプローチで機械学習を使用して信頼性を評価する。
既存の6つのトップリストと比較して、DomainHarvesterの許容リストは、最小のオーバーラップ、グローバル4%、ローカル0.1%を示し、悪意のあるドメインを含むリスクを著しく低減している。
- 参考スコア(独自算出の注目度): 2.6217304977339473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In cybersecurity, allow lists play a crucial role in distinguishing safe websites from potential threats. Conventional methods for compiling allow lists, focusing heavily on website popularity, often overlook infrequently visited legitimate domains. This paper introduces DomainHarvester, a system aimed at generating allow lists that include trustworthy yet infrequently visited domains. By adopting an innovative bottom-up methodology that leverages the web's hyperlink structure, DomainHarvester identifies legitimate yet underrepresented domains. The system uses seed URLs to gather domain names, employing machine learning with a Transformer-based approach to assess their trustworthiness. DomainHarvester has developed two distinct allow lists: one with a global focus and another emphasizing local relevance. Compared to six existing top lists, DomainHarvester's allow lists show minimal overlaps, 4\% globally and 0.1\% locally, while significantly reducing the risk of including malicious domains, thereby enhancing security. The contributions of this research are substantial, illuminating the overlooked aspect of trustworthy yet underrepresented domains and introducing DomainHarvester, a system that goes beyond traditional popularity-based metrics. Our methodology enhances the inclusivity and precision of allow lists, offering significant advantages to users and businesses worldwide, especially in non-English speaking regions.
- Abstract(参考訳): サイバーセキュリティでは、安全なウェブサイトと潜在的な脅威を区別する上で、許容リストが重要な役割を果たす。
従来は、ウェブサイトの人気に重きを置き、しばしば頻繁に訪れた正規のドメインを見落としていた。
本稿では、信頼に値するが頻繁に訪れるドメインを含む許容リストを生成するシステムであるDomainHarvesterを紹介する。
Webのハイパーリンク構造を活用する革新的なボトムアップ手法を採用することで、DomainHarvesterは、正当だが表現の浅いドメインを特定します。
このシステムはシードURLを使ってドメイン名を収集し、Transformerベースのアプローチで機械学習を使用して信頼性を評価する。
DomainHarvesterは、2つの異なる許容リストを開発した。
既存の6つのトップリストと比較して、DomainHarvesterの許容リストは、最小のオーバーラップ、グローバルな4\%、ローカルな0.1\%を示し、悪意のあるドメインを含むリスクを著しく低減し、セキュリティを向上している。
この研究の貢献は相当なもので、信頼に値するが表現されていないドメインの見過ごされた側面を浮き彫りにし、従来の人気ベースのメトリクスを超えるDomainHarvesterを導入した。
提案手法は,特に非英語圏において,ユーザや企業にとって重要な優位性を提供するため,許容リストの傾向と精度を高める。
関連論文リスト
- DomainLynx: Leveraging Large Language Models for Enhanced Domain Squatting Detection [2.6217304977339473]
ドメイン・スクワットはインターネットのセキュリティにとって重大な脅威となり、攻撃者はますます高度な技術を用いている。
本研究では,Large Language Models (LLMs) を利用した新しい複合AIシステムであるDomainLynxを紹介した。
2億900万のドメインから34,359のスクワットドメインを検出し、ベースラインの手法を2.5倍上回った。
論文 参考訳(メタデータ) (2024-10-02T23:32:09Z) - Say No to Freeloader: Protecting Intellectual Property of Your Deep Model [52.783709712318405]
コンパクト・アントランスファーブル・ピラミッド分離ドメイン(CUPI-Domain)は、権限のないドメインから権限のないドメインへの違法な転送に対する障壁として機能する。
本稿では,CUPI-Domain と CUPI-Domain の両方の特徴をアンカーとして選択する CUPI-Domain ジェネレータを提案する。
非許可ドメインが知られているかどうかに基づいて、CUPI-Domainを利用するための2つのソリューションを提供する。
論文 参考訳(メタデータ) (2024-08-23T15:34:33Z) - A Privacy-Preserving Framework with Multi-Modal Data for Cross-Domain
Recommendation [13.33679167416221]
クロスドメインレコメンデーション(CDR)は、スパースデータによるターゲットドメインのレコメンデーション精度を高めることを目的としている。
本稿では,P2M2-CDRと呼ばれるクロスドメイン勧告のためのマルチモーダルデータを用いたプライバシ保護フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-06T10:40:08Z) - PhishReplicant: A Language Model-based Approach to Detect Generated Squatting Domain Names [2.3999111269325266]
ドメインスクワット(Domain squatting)は、フィッシングサイトのドメイン名を作成するために攻撃者が使用するテクニックである。
本稿では、ドメイン名の言語的類似性に着目して、生成されたスクワットドメイン(GSD)を検出するPhishReplicantというシステムを提案する。
論文 参考訳(メタデータ) (2023-10-18T07:41:41Z) - Open SESAME: Fighting Botnets with Seed Reconstructions of Domain
Generation Algorithms [0.0]
ボットはドメイン生成アルゴリズム(DGA)を使用して擬似ランダムドメイン名を生成することができる
サイバー犯罪者は、そのようなドメインを登録して、定期的に変化するランデブーポイントをボットで設定することができる。
SESAMEは上記の2つのアプローチを組み合わせたシステムであり、自動シードレコンストラクションのためのモジュールを含んでいる。
論文 参考訳(メタデータ) (2023-01-12T14:25:31Z) - Memory-Guided Multi-View Multi-Domain Fake News Detection [39.035462224569166]
メモリ誘導型マルチドメインフェイクニュース検出フレームワーク(M$3$FEND)を提案する。
具体的には、潜在的なドメインラベルを発見可能なドメイン情報を強化するためのドメインメモリバンクを提案する。
リッチなドメイン情報を入力として使用することで、ドメインアダプタは、さまざまなドメインのニュースに対する複数のビューから識別情報を適応的に集約することができる。
論文 参考訳(メタデータ) (2022-06-26T07:09:23Z) - Domain Invariant Masked Autoencoders for Self-supervised Learning from
Multi-domains [73.54897096088149]
マルチドメインからの自己教師型学習のためのドメイン不変のMasked AutoEncoder (DiMAE)を提案する。
中心となる考え方は、入力画像を異なるドメインからのスタイルノイズで拡張し、拡張イメージの埋め込みからイメージを再構築することである。
PACSとDomainNetの実験は、最近の最先端の手法と比較して、DiMAEがかなりの利益を得ていることを示している。
論文 参考訳(メタデータ) (2022-05-10T09:49:40Z) - Bridging the Source-to-target Gap for Cross-domain Person
Re-Identification with Intermediate Domains [63.23373987549485]
クロスドメインの人物再識別(re-ID)は、ソースからターゲットドメインに識別された知識を転送することを目的としている。
中間ドメインモジュール(IDM)とミラー生成モジュール(MGM)を提案する。
IDMは、ソースドメインとターゲットドメインから隠れた層の特徴を混合することにより、複数の中間ドメインを生成する。
MGMは、特徴をIDM生成中間ドメインにマッピングすることで、元のアイデンティティを変更することなく導入される。
論文 参考訳(メタデータ) (2022-03-03T12:44:56Z) - Domain Consistency Regularization for Unsupervised Multi-source Domain
Adaptive Classification [57.92800886719651]
近年,深層学習に基づくマルチソース非教師付きドメイン適応(MUDA)が活発に研究されている。
MUDAのドメインシフトは、ソースドメインとターゲットドメインの間だけでなく、複数のソースドメインの間にも存在します。
本稿では、教師なしマルチソースドメイン適応分類において、ドメインの一貫性規則化を利用するエンドツーエンドのトレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-16T07:29:27Z) - Open Domain Generalization with Domain-Augmented Meta-Learning [83.59952915761141]
オープンドメイン一般化(OpenDG)の新しい実践的問題について研究する。
本稿では,オープンドメイン一般化表現を学ぶためのメタ学習フレームワークを提案する。
種々のマルチドメインデータセットの実験結果から、提案したドメイン拡張メタラーニング(DAML)が、未確認ドメイン認識の先行手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-08T09:12:24Z) - Mind the Gap: Enlarging the Domain Gap in Open Set Domain Adaptation [65.38975706997088]
オープンセットドメイン適応(OSDA)は、ターゲットドメインに未知のクラスが存在することを前提としている。
既存の最先端手法は、より大きなドメインギャップが存在する場合、かなりの性能低下を被ることを示す。
我々は、より大きなドメインギャップに特に対処するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-08T14:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。