論文の概要: From Production SIEM to Reusable Cybersecurity Artifacts
- arxiv url: http://arxiv.org/abs/2606.21389v1
- Date: Fri, 19 Jun 2026 12:53:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 13:48:53.117045
- Title: From Production SIEM to Reusable Cybersecurity Artifacts
- Title(参考訳): SIEMの生産から再利用可能なサイバーセキュリティアーティファクトへ
- Authors: Sidnei Barbieri, Leonardo Vaz de Meneses, Ágney Lopes Roth Ferraz, Wagner Comin Sonaglio, Lourenço Alves Pereira Júnior,
- Abstract要約: 最も現実的なセキュリティ・オペレーション・センター(SOC)のデータは生産用テレメトリであるが、生ログを公開できないため科学的にはアクセスできない。
プライベート生産テレメトリと再利用可能な研究成果物の境界を設計対象として扱う。
- 参考スコア(独自算出の注目度): 0.503315505352304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Operational evidence is not automatically scientific evidence. The most realistic Security Operations Center (SOC) data is production telemetry, yet it remains scientifically inaccessible because raw logs cannot be released; as a result, research relies on synthetic or dated datasets. We treat the boundary between private production telemetry and reusable research artifacts as the design object: a methodology that extracts, anonymizes, structures, and validates Security Information and Event Management (SIEM) data from a production financial SOC while preserving task-relevant investigative structure within a declared privacy boundary. Two consumers stress the same artifact. As training material, it fails loudly: 37 MITRE ATT&CK-mapped HIKARI challenges work only when anonymization preserves temporal order and entity consistency. As a measurement substrate, it fails quietly: across 200 SOCpilot incidents, a deterministic verifier detects non-compliant Large Language Model (LLM) actions that are absent from the human baseline. The result is a measurable privacy-utility boundary rather than a formal anonymity claim.
- Abstract(参考訳): 操作上の証拠は、自動的に科学的証拠ではない。
最も現実的なセキュリティ・オペレーション・センター(SOC)のデータは生産テレメトリであるが、生のログを公開できないため科学的にはアクセスできない。
我々は、プライベート生産テレメトリと再利用可能な研究成果物の境界を設計対象として扱う: 宣言されたプライバシー境界内でタスク関連調査構造を保持しながら、生産金融SOCからセキュリティ情報およびイベント管理(SIEM)データを抽出し、匿名化し、検証する方法論。
2人の消費者が同じアーティファクトを強調します。
37 MITRE ATT&CKマッピングされたHIKARIは、匿名化が時間的順序とエンティティの整合性を維持する場合にのみ機能する。
200のSOCpilotインシデントに対して、決定論的検証器は、人間のベースラインにない非準拠のLarge Language Model(LLM)アクションを検出する。
その結果は、正式な匿名性主張ではなく、測定可能なプライバシーとユーティリティの境界となります。
関連論文リスト
- ARENA: An Architecture for Measuring the Transferability of Autonomous Cyber Defense [0.4523163728236143]
最も現実的なセキュリティ・オペレーション・センター(SOC)のデータは生産用テレメトリであるが、生ログを公開できないため科学的にはアクセスできない。
プライベート生産テレメトリと再利用可能な研究成果物の境界を設計対象として扱う。
論文 参考訳(メタデータ) (2026-06-19T12:35:00Z) - Phantoms and Disclosures: a Causal Framework for Auditing Synthetic Data [56.86147283213652]
データ開示の検出と説明を目的とした,カスタマイズ可能な実証監査フレームワークを提案する。
本フレームワークでは,ユーザの情報を直接再現する「真の開示」と,ユーザのデータを偶発的に生成する「幻の開示」とを区別する機構を導入する。
論文 参考訳(メタデータ) (2026-06-15T16:54:02Z) - Advancing the State-of-the-Art in Empirical Privacy Auditing [21.545624969554996]
経験的プライバシー監査は、メンバーシップ推論(MI)やリコンストラクションアタックの現実的なデータ漏洩を測定する。
EPAの主な課題は、プライバシーに敏感なトレーニングデータと混ざったカナリアの例を設計することだ。
高温サンプリングによる合成カナリアの生成を提案する。
論文 参考訳(メタデータ) (2026-06-09T06:50:49Z) - Instrumented data for causal scientific machine learning [0.0]
センサ・オブザーバが、明示的で、編集可能なパラメータと、伝播するアレタリック/エピステミック不確実性を備えた、完全に特定された、解決者支援のシミュレーションになることを示す。
検証、監査、代理訓練の短期的な効果は、計算生物学、気候、材料、流体力学、医療画像に及んでいる。
長期的な、偽りやすい含意は、科学的推論の基礎モデルに関するものである。
論文 参考訳(メタデータ) (2026-06-05T21:53:39Z) - The DCR Delusion: Measuring the Privacy Risk of Synthetic Data [8.673204690445955]
会員推論攻撃(MIA)は、合成データセットのプライバシーを実証的に評価するための金の標準として広く考えられている。
これらの指標は、トレーニングデータと生成された合成データとの類似度を測定することで、プライバシを推定する。
本研究では,DCRや他の距離ベースメトリクスは計算コストが低いが,プライバシリークの特定に失敗していることを示す。
論文 参考訳(メタデータ) (2025-05-02T18:21:14Z) - Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。
これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-02-20T18:53:53Z) - Stop Uploading Test Data in Plain Text: Practical Strategies for
Mitigating Data Contamination by Evaluation Benchmarks [70.39633252935445]
データ汚染は、大規模な自動クロールコーパスで事前訓練されたモデルの台頭によって、普及し、課題となっている。
クローズドモデルの場合、トレーニングデータはトレードシークレットになり、オープンモデルであっても汚染を検出するのは簡単ではない。
1)公開するテストデータを公開鍵で暗号化し,デリバティブ配信を許可する,(2)クローズドAPI保持者からの要求トレーニング排他的コントロールを許可する,(2)評価を拒否してテストデータを保護する,(3)インターネット上のソリューションで表示されるデータを避け,インターネット由来のWebページコンテキストを解放する,という3つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-17T12:23:38Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - A Linear Reconstruction Approach for Attribute Inference Attacks against Synthetic Data [1.5293427903448022]
合成データに対する新しい属性推論攻撃を導入する。
攻撃は任意の記録でも極めて正確であることを示す。
次に、プライバシー保護と統計ユーティリティ保護のトレードオフを評価する。
論文 参考訳(メタデータ) (2023-01-24T14:56:36Z) - No Free Lunch in "Privacy for Free: How does Dataset Condensation Help
Privacy" [75.98836424725437]
データプライバシを保護するために設計された新しい手法は、慎重に精査する必要がある。
プライバシ保護の失敗は検出し難いが,プライバシ保護法を実装したシステムが攻撃された場合,破滅的な結果につながる可能性がある。
論文 参考訳(メタデータ) (2022-09-29T17:50:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。