論文の概要: Hesperus is Phosphorus: Mapping Threat Actor Naming Taxonomies at Scale
- arxiv url: http://arxiv.org/abs/2512.00857v1
- Date: Sun, 30 Nov 2025 12:06:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.458874
- Title: Hesperus is Phosphorus: Mapping Threat Actor Naming Taxonomies at Scale
- Title(参考訳): Hesperus is Phosphorus: Mapping Threat Actor Naming Taxonomies at Scale
- Authors: Gonzalo Roa, Manuel Suarez-Roman, Juan Tapiador,
- Abstract要約: 本稿では,主要なサイバー脅威インテリジェンス(CTI)ベンダー間でのTreat Actor(TA)命名規則の不整合の問題について検討する。
現在の分散型でプロプライエタリな命名法は、研究者にとって混乱と重大な障害を生み出している。
- 参考スコア(独自算出の注目度): 0.5658568324275768
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies the problem of Threat Actor (TA) naming convention inconsistency across leading Cyber Threat Intelligence (CTI) vendors. The current decentralized and proprietary nomenclature creates confusion and significant obstacles for researchers, including difficulties in integrating and correlating disparate CTI reports and TA profiles. This paper introduces HiP (Hesperus is Phosphorus, a reference to the classic question about the Morning and the Evening Star), a methodology for normalizing, integrating, and clustering TA names presumably corresponding to the same entity. Using HiP, we analyze a large dataset collected from 15 sources and spanning 13,371 CTI reports, 17 vendor taxonomies, 3,287 TA names, and 8 mappings between them. Our analysis of the resulting name graph provides insights on key features of the problem, such as the concentration of aliases on a relatively small subset of TAs, the evolution of this phenomenon over the years, and the factors that could explain TA name proliferation. We also report errors in the mappings and methodological pitfalls that contribute to make certain TA name clusters larger than they should be, including the use of temporary names for activity clusters, the existence of common tools and infrastructure, and overlapping operations. We conclude with a discussion on the inherent difficulties to adopt a TA naming standard, a quest fundamentally hampered by the need to share highly-sensitive telemetry that is private to each CTI vendor.
- Abstract(参考訳): 本稿では,主要なサイバー脅威インテリジェンス(CTI)ベンダー間でのTreat Actor(TA)命名規則の不整合の問題について検討する。
現在の分散されたプロプライエタリな命名法は、異なるCTIレポートとTAプロファイルの統合と関連付けが困難であるなど、研究者にとって混乱と重大な障害を生み出している。
本稿では,HIP(Hesperus is Phosphorus, a reference to the classic question about the Morning and the Evening Star)を紹介する。
HiPを用いて15のソースから収集された大規模なデータセットを分析し,13,371のCTIレポート,17のベンダ分類,3,287のTA名,8つのマッピングを対象とする。
得られた名前グラフの分析は、比較的小さなTAのサブセットへのエイリアス濃度、長年にわたるこの現象の進化、TA名の増殖を説明する要因など、問題の鍵となる特徴についての洞察を提供する。
また,活動クラスタに一時的な名前を使うこと,共通ツールやインフラストラクチャの存在,重複する操作など,特定のTA名クラスタのサイズに寄与するマッピングや方法論の落とし穴についても報告する。
我々は、各CTIベンダーにプライベートな高感度テレメトリを共有する必要性により、基本的に妨げられているTA命名基準を採用することの難しさについて、議論を締めくくった。
関連論文リスト
- On the Structure and Semantics of Identifier Names Containing Closed Syntactic Category Words [19.94735883254009]
本稿では,文法パターンの概念を拡張した識別子名の言語構造について検討する。
特定の焦点はクローズドな構文カテゴリーであり、ソフトウェア工学で研究されることはめったにない。
閉圏文法パターンとプログラムの振る舞いの関係を、基底理論に着想を得た符号化、統計、パターン分析を用いて解析する。
論文 参考訳(メタデータ) (2025-05-24T00:58:50Z) - Exploring a Large Language Model for Transforming Taxonomic Data into OWL: Lessons Learned and Implications for Ontology Development [63.74965026095835]
本稿では,種分類におけるChatGPT-4を用いた農業製品型オントロジー(APTO)におけるオルガニズムモジュールの開発について検討する。
本手法では,ChatGPT-4を用いてGBIF Backbone APIからデータを抽出し,APTOのさらなる統合のためのファイルを生成する。
1つは、BrowserOPプラグインを介してタスクを実行するためのChatGPT-4の一連のプロンプトを発行すること、2つは、タスクを実行するためのPythonアルゴリズムを設計するためにChatGPT-4を指示することである。
論文 参考訳(メタデータ) (2025-04-25T19:05:52Z) - Noise Contrastive Estimation-based Matching Framework for Low-Resource Security Attack Pattern Recognition [45.34519578504934]
TTP(Tactics, Techniques and Procedures)は、サイバーセキュリティドメインにおける高度な攻撃パターンを表す。
そこで本研究では,TTPラベルへのテキストの割り当てが,両者の直接的な意味的類似性によって決定される,異なる学習パラダイムの問題を定式化する。
本稿では,効果的なサンプリングベース学習機構を備えたニューラルマッチングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-18T19:02:00Z) - NameGuess: Column Name Expansion for Tabular Data [28.557115822407294]
我々は列名を自然言語生成問題として拡張するための新しいタスクであるNameGuessを紹介した。
384K短縮カラムペアのトレーニングデータセットを作成します。
表の内容や列のヘッダー名を条件にすることで、自動回帰言語モデルを強化する。
論文 参考訳(メタデータ) (2023-10-19T23:11:37Z) - MapperGPT: Large Language Models for Linking and Mapping Entities [1.5340902251924438]
MapperGPTは、大規模言語モデルを用いて、マッピングを後処理のステップとしてレビューし、洗練するアプローチである。
ハイリコール法と組み合わせることで,MapperGPTは精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2023-10-05T16:43:04Z) - Incorporating Class-based Language Model for Named Entity Recognition in Factorized Neural Transducer [50.572974726351504]
クラスベースのLMをFNTに組み込んだ新しいE2EモデルであるC-FNTを提案する。
C-FNTでは、名前付きエンティティのLMスコアは、その表面形式の代わりに名前クラスに関連付けることができる。
実験の結果,提案したC-FNTは,単語認識の性能を損なうことなく,名前付きエンティティの誤りを著しく低減することがわかった。
論文 参考訳(メタデータ) (2023-09-14T12:14:49Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Learning to Decouple Relations: Few-Shot Relation Classification with
Entity-Guided Attention and Confusion-Aware Training [49.9995628166064]
本稿では,2つのメカニズムを備えたモデルであるCTEGを提案する。
一方、注意を誘導するEGA機構を導入し、混乱を引き起こす情報をフィルタリングする。
一方,コンフュージョン・アウェア・トレーニング(CAT)法は,関係の識別を明示的に学習するために提案されている。
論文 参考訳(メタデータ) (2020-10-21T11:07:53Z) - Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks [81.00481125272098]
本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
論文 参考訳(メタデータ) (2020-08-30T06:08:20Z) - What's in a Name? Are BERT Named Entity Representations just as Good for
any other Name? [18.11382921200802]
BERTをベースとしたNLPモデルの名前付きエンティティ表現は,入力中の同じ型付きクラスからの置換に対するロバスト性を調べることで評価する。
タイプアノテーションの不確かさとラベル予測を共同でモデル化しながら,複数の代替品からの予測をアンサンブルする簡単な方法を提案する。
3つのNLPタスクの実験結果から,本手法は自然・敵対的データセットの堅牢性を向上し,精度を向上することが示された。
論文 参考訳(メタデータ) (2020-07-14T08:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。