論文の概要: Empirical Quantification of Spurious Correlations in Malware Detection
- arxiv url: http://arxiv.org/abs/2506.09662v1
- Date: Wed, 11 Jun 2025 12:32:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:02.953459
- Title: Empirical Quantification of Spurious Correlations in Malware Detection
- Title(参考訳): マルウェア検出におけるスパーラス相関の実証的定量化
- Authors: Bianca Perasso, Ludovico Lozza, Andrea Ponte, Luca Demetrio, Luca Oneto, Fabio Roli,
- Abstract要約: モデルがコンパイラが残した空の空間にどのように依存しているかを示す。
運用にどちらが適しているかをよりよく理解するために、エンド・ツー・エンドの2つのモデルのランキングを導入します。
- 参考スコア(独自算出の注目度): 7.217646443972148
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: End-to-end deep learning exhibits unmatched performance for detecting malware, but such an achievement is reached by exploiting spurious correlations -- features with high relevance at inference time, but known to be useless through domain knowledge. While previous work highlighted that deep networks mainly focus on metadata, none investigated the phenomenon further, without quantifying their impact on the decision. In this work, we deepen our understanding of how spurious correlation affects deep learning for malware detection by highlighting how much models rely on empty spaces left by the compiler, which diminishes the relevance of the compiled code. Through our seminal analysis on a small-scale balanced dataset, we introduce a ranking of two end-to-end models to better understand which is more suitable to be put in production.
- Abstract(参考訳): エンドツーエンドのディープラーニングは、マルウェアを検出するための不整合パフォーマンスを示すが、そのような成果は、素早い相関(推論時間に高い関連性を持つが、ドメイン知識によって役に立たないことが知られている)を活用することで達成される。
これまでの研究では、ディープネットワークは主にメタデータに焦点を当てていたが、決定に対する影響を定量化することなく、この現象をさらに調査することはなかった。
本研究では,コンパイラが残した空き空間にどの程度のモデルが依存しているかを強調することにより,マルウェア検出におけるスプリアス相関がディープラーニングに与える影響の理解を深める。
小規模でバランスの取れたデータセットに関する初歩的な分析を通じて、2つのエンドツーエンドモデルのランキングを導入し、どのモデルが本番環境でより適切なのかをよりよく理解します。
関連論文リスト
- Severing Spurious Correlations with Data Pruning [2.93774265594295]
深層ニューラルネットワークは、トレーニングされているデータに現れる刺激的な相関を学習し、依存することが示されている。
このような相関関係は、これらの相関関係がもはや保たない実世界において、これらのネットワークが機能不全を引き起こす可能性がある。
我々はこれらのサンプルを含むトレーニングデータの小さなサブセットを識別し、プーンする新しいデータプルーニング手法を開発した。
論文 参考訳(メタデータ) (2025-03-24T00:57:32Z) - The Multiple Dimensions of Spuriousness in Machine Learning [3.475875199871536]
データからの相関学習は、今日の機械学習(ML)と人工知能(AI)研究の基礎となる。
このようなアプローチは、ビッグデータコーパス内のパターン付き関係の自動発見を可能にするが、意図しない相関が捕捉された場合、障害モードの影響を受けやすい。
この脆弱性は、しばしば、パフォーマンス、公平性、堅牢性をモデル化する障害として批判される、急進性の尋問への関心を拡大した。
論文 参考訳(メタデータ) (2024-11-07T13:29:32Z) - Aggregation Artifacts in Subjective Tasks Collapse Large Language Models' Posteriors [74.04775677110179]
In-context Learning (ICL) は、Large Language Models (LLM) を用いた自然言語処理の主要な手法となっている。
本研究は,低アグリゲーション,異質なアノテーションを組み合わせたアグリゲーションの結果が,プロンプトに有害なノイズを生じさせるアノテーションのアーティファクトに繋がるかどうかを考察する。
この結果から,アグリゲーションは主観的タスクのモデル化において不明瞭な要因であり,代わりに個人をモデリングすることを重視することが示唆された。
論文 参考訳(メタデータ) (2024-10-17T17:16:00Z) - Understanding and Mitigating Spurious Correlations in Text
Classification with Neighborhood Analysis [69.07674653828565]
機械学習モデルは、トレーニングセットに存在するが一般的な状況では当てはまらない急激な相関を利用する傾向にある。
本稿では, 周辺分析と呼ばれる新しい視点から, 突発的相関がもたらす意味について考察する。
本稿では,テキスト分類における素早い相関を緩和する正規化手法であるNFL(doN't Forget your Language)を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:55:50Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Detecting Human-Object Interactions with Action Co-occurrence Priors [108.31956827512376]
人-物間相互作用(HOI)検出タスクにおける一般的な問題は、多数のHOIクラスが少数のラベル付き例しか持たないことである。
我々は、人間と物体の相互作用の間に自然の相関と反相関が存在することを観察した。
我々はこれらの先行知識を学習し、特に稀なクラスにおいてより効果的な訓練に活用する手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T02:47:45Z) - Learning Causal Models Online [103.87959747047158]
予測モデルは、予測を行うためにデータの急激な相関に依存することができる。
強い一般化を達成するための一つの解決策は、モデルに因果構造を組み込むことである。
本稿では,突発的特徴を継続的に検出・除去するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T20:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。