論文の概要: Exploring Semantic Labeling Strategies for Third-Party Cybersecurity Risk Assessment Questionnaires
- arxiv url: http://arxiv.org/abs/2602.10149v1
- Date: Mon, 09 Feb 2026 18:36:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.183632
- Title: Exploring Semantic Labeling Strategies for Third-Party Cybersecurity Risk Assessment Questionnaires
- Title(参考訳): 第三者サイバーセキュリティリスクアセスメントのためのセマンティックラベリング手法の探索
- Authors: Ali Nour Eldin, Mohamed Sellami, Walid Gaaloul,
- Abstract要約: 第三者リスクアセスメント(英: Third-Party Risk Assessment、TPRA)は、ISO/IECやNISTなどの標準に対してサプライヤーを評価するための中核的なサイバーセキュリティの実践である。
本稿では,セマンティックラベルを用いたTPRAサイバーセキュリティ問題の整理と検索戦略について検討する。
- 参考スコア(独自算出の注目度): 0.3568466510804538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Third-Party Risk Assessment (TPRA) is a core cybersecurity practice for evaluating suppliers against standards such as ISO/IEC 27001 and NIST. TPRA questionnaires are typically drawn from large repositories of security and compliance questions, yet tailoring assessments to organizational needs remains a largely manual process. Existing retrieval approaches rely on keyword or surface-level similarity, which often fails to capture implicit assessment scope and control semantics. This paper explores strategies for organizing and retrieving TPRA cybersecurity questions using semantic labels that describe both control domains and assessment scope. We compare direct question-level labeling with a Large Language Model (LLM) against a hybrid semi-supervised semantic labeling (SSSL) pipeline that clusters questions in embedding space, labels a small representative subset using an LLM, and propagates labels to remaining questions using k-Nearest Neighbors; we also compare downstream retrieval based on direct question similarity versus retrieval in the label space. We find that semantic labels can improve retrieval alignment when labels are discriminative and consistent, and that SSSL can generalize labels from a small labeled subset to large repositories while substantially reducing LLM usage and cost.
- Abstract(参考訳): 第三者リスクアセスメント(英: Third-Party Risk Assessment、TPRA)は、ISO/IEC 27001やNISTなどの標準に対してサプライヤーを評価するための中核的なサイバーセキュリティの実践である。
TPRAのアンケートは通常、セキュリティとコンプライアンスに関する質問の大規模なリポジトリから作成されるが、組織のニーズに対する評価を調整することは、ほとんど手作業のプロセスのままである。
既存の検索手法はキーワードや表面レベルの類似性に依存しており、暗黙のアセスメントスコープと制御セマンティクスのキャプチャに失敗することが多い。
本稿では,制御領域と評価範囲の両方を記述したセマンティックラベルを用いて,TPRAのサイバーセキュリティ問題を整理・検索する戦略について検討する。
直接質問レベルのラベル付けとLLM(Large Language Model)と、埋め込み空間における質問をクラスタリングするハイブリッド半教師付きセマンティックラベリング(SSSL)パイプラインを比較し、LLMを用いて小さな代表サブセットをラベル付けし、k-Nearest Neighborsを用いて残りの質問にラベルを伝搬する。
我々は,ラベルが識別的かつ一貫性のある場合,セマンティックラベルが検索アライメントを改善すること,ラベルを小さなラベル付きサブセットから大きなリポジトリに一般化すると同時に,LLMの使用とコストを大幅に削減できることを見出した。
関連論文リスト
- Poly-Vector Retrieval: Reference and Content Embeddings for Legal Documents [0.0]
法的文脈では、ユーザーは自分のコンテンツではなく、ラベルやあだ名によってしばしばノルムを参照する。
本稿では,各法則に複数の異なる埋め込みを割り当てるポリレトリヴァルについて述べる。
ラベル中心のクエリの検索精度を大幅に向上し、内部および外部の参照を解決できる。
論文 参考訳(メタデータ) (2025-04-09T17:54:11Z) - Leveraging Label Semantics and Meta-Label Refinement for Multi-Label Question Classification [11.19022605804112]
本稿では,ラベルのセマンティクスとメタラベルの精巧化を活用して,複数ラベルの質問分類を検索する新手法RR2QCを紹介する。
実験の結果,RR2QCはPrecision@KとF1スコアの既存の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-04T06:27:14Z) - TnT-LLM: Text Mining at Scale with Large Language Models [24.731544646232962]
大規模言語モデル(LLM)は、最小限の努力でエンドツーエンドのラベル生成と割り当てのプロセスを自動化する。
我々は,TnT-LLMが最先端のベースラインと比較した場合,より正確で関連性の高いラベルを生成することを示す。
また、現実のアプリケーションにおける大規模テキストマイニングにLLMを使うことの課題と機会に関する実践的経験と洞察を共有します。
論文 参考訳(メタデータ) (2024-03-18T18:45:28Z) - Noise Contrastive Estimation-based Matching Framework for Low-Resource Security Attack Pattern Recognition [45.34519578504934]
TTP(Tactics, Techniques and Procedures)は、サイバーセキュリティドメインにおける高度な攻撃パターンを表す。
そこで本研究では,TTPラベルへのテキストの割り当てが,両者の直接的な意味的類似性によって決定される,異なる学習パラダイムの問題を定式化する。
本稿では,効果的なサンプリングベース学習機構を備えたニューラルマッチングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-18T19:02:00Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Weakly-supervised Salient Instance Detection [65.0408760733005]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2020-09-29T09:47:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。