論文の概要: Anonymous YARA Rules Are Not Anonymous
- arxiv url: http://arxiv.org/abs/2605.26791v1
- Date: Tue, 26 May 2026 10:01:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.870184
- Title: Anonymous YARA Rules Are Not Anonymous
- Title(参考訳): 匿名のYARAルールは匿名ではない
- Authors: Usman Rabiu Isah, Laurent Bobelin, Pascal Berthomé,
- Abstract要約: YARAルールは、マルウェアに対する集団防御を可能にするために、脅威情報コミュニティ間で広く共有されている。
この仮定の有効性を評価するため,YARAルールテキストのみから,どれだけの量の推定が可能かを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: YARA rules are widely shared across threat intelligence communities to enable collective defence against malware. This practice implicitly assumes that removing metadata (e.g., author fields) sufficiently protects the identity of contributing organisations. To assess the validity of this assumption, we systematically evaluate how much can be inferred from YARA rule text alone. Specifically, using a corpus of 23,305 rules from three major public repositories, we train independent classifiers along four stylometric fingerprint dimensions: individual author, source repository, malware family, and temporal drift, using three complementary methods: lexical n-grams (Burrows' Delta), syntactic AST features (Caliskan-Islam), and fine-tuned CodeBERT. Our results demonstrate that repository origin is almost perfectly recoverable (up to 99% accuracy), individual authors can be re-identified well above chance (76%), and malware family classification reaches 95%. Comparing the same repository attribution task across full-history and time-restricted subsets reveals a 9-18% accuracy gap, providing preliminary evidence of temporal drift in repository fingerprints.To further disentangle content from style, we conduct per-malware family author attribution experiments. Even when the malware family is the same for all samples considered, authors can still be re-identified for five of seven tested families (mean accuracy 74.6%). These findings constitute the first systematic demonstration that YARA rule sharing is a measurable OPSEC attack surface, and that metadata removal alone does not mitigate it.
- Abstract(参考訳): YARAルールは、マルウェアに対する集団防御を可能にするために、脅威情報コミュニティ間で広く共有されている。
このプラクティスは、メタデータ(例えば、著者フィールド)の削除が、貢献する組織のアイデンティティを十分に保護していると暗黙的に仮定します。
この仮定の有効性を評価するために,YARAルールテキストのみから,どれだけの量の推定が可能かを体系的に評価する。
具体的には、3つの主要な公開リポジトリから23,305ルールのコーパスを用いて、個々の著者、ソースレポジトリ、マルウェアファミリー、時間的ドリフトの4つのスタイルの指紋次元に沿って独立した分類器を訓練し、語彙n-gram(Burrows' Delta)、構文AST特徴(Caliskan-Islam)、微調整CodeBERTという3つの補完的な手法を用いて訓練する。
以上の結果から,レポジトリの出所はほぼ完全に復元可能である(精度は99%)こと,個々の著者を偶然に再同定できる(76%)こと,マルウェアの家族分類が95%に達することが示唆された。
同じリポジトリ帰属タスクをフルヒストリーとタイムリミテッドサブセットで比較すると、9~18%の精度差が示され、レポジトリ指紋における時間的ドリフトの予備的証拠となる。
マルウェアファミリーが検討されたすべてのサンプルで同一である場合でも、著者は7つのテストされたファミリーのうち5つ(平均74.6%)で再識別することができる。
これらの結果は,YARAルール共有がOPSECアタックサーフェスであり,メタデータの除去だけでは軽減されないという,最初の体系的な実証である。
関連論文リスト
- Architecture Matters: Comparing RAG Systems under Knowledge Base Poisoning [0.0]
RAGシステムは知識ベース中毒に弱いが、既存の攻撃はほとんどバニラレトリプタン生成パイプラインに対して評価されている。
我々は,921の自然質問QAペアに対して,制御された単一文書中毒の4つのRAGアーキテクチャ(vanilla RAG, agentic RAG, MADAM-RAG, Recursive Language Models)を評価した。
論文 参考訳(メタデータ) (2026-05-07T03:36:14Z) - TwinGate: Stateful Defense against Decompositional Jailbreaks in Untraceable Traffic via Asymmetric Contrastive Learning [60.68349524623048]
分解されたジェイルブレイクは、大きな言語モデルにとって重大な脅威となる。
我々はステートフルなデュアルエンコーダ防御フレームワークであるTwinGateを紹介する。
我々は、8600の異なる悪意のある意図にまたがる360万以上の命令の包括的なデータセットを構築した。
論文 参考訳(メタデータ) (2026-04-30T13:44:01Z) - The Last Human-Written Paper: Agent-Native Research Artifacts [106.47848184955576]
本稿では,物語紙を機械処理可能な研究パッケージに置き換えるプロトコルであるAgent-Native Research Artifact(ARA)を紹介する。
通常の開発において決定と終了をキャプチャするLive Research Manager、レガシPDFとリポジトリをARAに変換するARAコンパイラ、人間レビュアーが重要性、ノベルティ、味にフォーカスできるように客観的チェックを自動化するARAネイティブレビューシステムである。
論文 参考訳(メタデータ) (2026-04-27T16:23:09Z) - Making MLLMs Blind: Adversarial Smuggling Attacks in MLLM Content Moderation [54.38271718421492]
敵の密輸攻撃は人間とAIの能力ギャップを悪用する。
有害なコンテンツを人間の読みやすい視覚形式にエンコードする。
我々は緩和戦略の予備的な調査を行う。
論文 参考訳(メタデータ) (2026-04-08T11:13:16Z) - Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw [87.97230960702274]
本稿では,OpenClawの安全性評価について紹介する。
エージェントの永続状態を3次元に統一するCIK分類法を導入する。
評価では、ライブOpenClawインスタンス上の12のアタックシナリオをカバーしています。
論文 参考訳(メタデータ) (2026-04-06T15:27:05Z) - Mapping the Exploitation Surface: A 10,000-Trial Taxonomy of What Makes LLM Agents Exploit Vulnerabilities [0.0]
ツールアクセスを持つLLMエージェントは、セキュリティ脆弱性を悪用することができる。
不明なのは、システムのどの機能がこの振る舞いをトリガーし、どれがそうでないかである。
7つのモデル,37のプロンプト条件,12の仮説的攻撃次元の1万の試行に基づく系統分類を提示する。
論文 参考訳(メタデータ) (2026-04-06T09:44:34Z) - Can Adversarial Code Comments Fool AI Security Reviewers -- Large-Scale Empirical Study of Comment-Based Attacks and Defenses Against LLM Code Analysis [0.0]
敵対的なコメントは、検出精度に小さな、統計的に重要でない効果をもたらす。
複雑な敵戦略は単純な操作的コメントに勝るものではない。
コメントストリッピングは、有用なコンテキストを削除することで、より弱いモデルの検出を減らす。
論文 参考訳(メタデータ) (2026-02-18T00:34:17Z) - Detecting Corpus-Level Knowledge Inconsistencies in Wikipedia with Large Language Models [11.16952630564181]
不整合, 特定の事実的不整合に着目し, コーパスレベルの不整合検出の課題を導入する。
本稿では,LLM推論と検索を組み合わせたエージェントシステムであるCLAIREについて述べる。
経験豊富なウィキペディア編集者によるユーザスタディでは、87.5%がCLAIREを使用する際の信頼性が高く、参加者は同じ時間内に64.7%の矛盾が見つかった。
論文 参考訳(メタデータ) (2025-09-27T10:32:41Z) - SHIELD: Thwarting Code Authorship Attribution [11.311401613087742]
著者の帰属はますます正確になり、匿名を希望するプログラマには深刻なプライバシー上のリスクが生じる。
対戦型コード例に対する異なるコードオーサシップ属性アプローチの堅牢性を検討するためにShiELDを導入する。
論文 参考訳(メタデータ) (2023-04-26T02:55:28Z) - Defending against Reconstruction Attacks with R\'enyi Differential
Privacy [72.1188520352079]
レコンストラクション攻撃により、敵は訓練されたモデルのみにアクセスすることで、トレーニングセットのデータサンプルを再生することができる。
差別化プライバシはこのような攻撃に対する既知の解決策であるが、比較的大きなプライバシ予算で使用されることが多い。
また、同機構により、従来の文献よりも優れた復元攻撃に対するプライバシー保証を導出できることを示す。
論文 参考訳(メタデータ) (2022-02-15T18:09:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。