論文の概要: Landseer: Exploring the Machine Learning Defense Landscape
- arxiv url: http://arxiv.org/abs/2605.27148v2
- Date: Mon, 01 Jun 2026 21:00:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 18:57:50.075345
- Title: Landseer: Exploring the Machine Learning Defense Landscape
- Title(参考訳): ランドシーア: 機械学習の防衛景観を探る
- Authors: Ayushi Sharma, Rosemary Agbozo, Santiago Torres-Arias, Zahra Ghodsi,
- Abstract要約: 機械学習(ML)ディフェンスをMLライフサイクルに統合するためのフレームワークであるLandseerを紹介します。
予備研究では,35個の最先端の機械学習ディフェンスを同定した。
本研究は, 防衛家族間の複製能力のギャップを明らかにし, 複数防衛を統合する上での課題と機会について考察した。
- 参考スコア(独自算出の注目度): 8.595181704811887
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning systems face diverse threats that undermine robustness, privacy, and fairness. Although many defenses have been proposed, each typically addresses a single risk in isolation. Real-world deployments, however, require these defenses to be composed to meet multiple guarantees simultaneously. The process of composing defenses is complex and not well understood, and its impact on performance and security remains unclear. We present Landseer, a modular framework for integrating machine learning (ML) defenses into the ML lifecycle and systematically evaluating their composition. Landseer encapsulates defenses as containerized modules, allowing existing and new techniques to be plugged in with minimal effort. Its evaluation engine automates experiments across multiple metrics, supporting the study of defenses both individually and in combination. In a preliminary study, we identified 35 state-of-the-art machine learning defenses. After filtering for reproducibility, we analyzed their performance using Landseer's unified evaluation process. Our findings reveal gaps in replicability across defense families and provide insights into the challenges and opportunities in integrating multiple defenses, establishing a foundation for improving the reliability of machine learning systems.
- Abstract(参考訳): 機械学習システムは、堅牢性、プライバシー、公正性を損なうさまざまな脅威に直面している。
多くの防衛策が提案されているが、通常は孤立した単一リスクに対処する。
しかし、現実のデプロイメントでは、複数の保証を同時に満たすためにこれらの防御を構成する必要がある。
防衛を構築するプロセスは複雑であり、十分に理解されておらず、パフォーマンスとセキュリティへの影響は未だ不明である。
機械学習(ML)ディフェンスをMLライフサイクルに統合し,その構成を体系的に評価するモジュール型フレームワークであるLandseerを紹介する。
Landseerは防御をコンテナ化されたモジュールとしてカプセル化し、既存のテクニックと新しいテクニックを最小限の労力でプラグインできる。
その評価エンジンは、複数のメトリクスにわたる実験を自動化し、個別と組み合わせた防御の研究を支援する。
予備研究では,35個の最先端の機械学習ディフェンスを同定した。
再現性をフィルタした後,Landseerの統一評価プロセスを用いて,その性能を解析した。
本研究は, 防衛家族間の複製能力のギャップを明らかにし, 複数の防衛システムを統合する上での課題と機会に関する洞察を提供し, 機械学習システムの信頼性向上のための基盤を確立した。
関連論文リスト
- Vision-Language-Action Safety: Threats, Challenges, Evaluations, and Mechanisms [61.29786895012393]
VLA(Vision-Language-Action)モデルがインボディードインテリジェンスのための統一された基盤として登場している。
この調査は、ビジョン・ランゲージ・アクションモデルにおける安全性の統一的で最新の概要を提供する。
論文 参考訳(メタデータ) (2026-04-26T15:58:19Z) - A Systematic Survey of Model Extraction Attacks and Defenses: State-of-the-Art and Perspectives [65.3369988566853]
近年の研究では、敵が対象モデルの機能を複製できることが示されている。
モデル抽出攻撃は知的財産権、プライバシー、システムのセキュリティに脅威をもたらす。
本稿では,攻撃機構,防衛手法,計算環境に応じてMEAを分類する新しい分類法を提案する。
論文 参考訳(メタデータ) (2025-08-20T19:49:59Z) - A Survey on Model Extraction Attacks and Defenses for Large Language Models [55.60375624503877]
モデル抽出攻撃は、デプロイされた言語モデルに重大なセキュリティ脅威をもたらす。
この調査は、抽出攻撃と防御攻撃の包括的分類、機能抽出への攻撃の分類、データ抽出の訓練、およびプロンプトターゲット攻撃を提供する。
モデル保護,データプライバシ保護,迅速なターゲット戦略に編成された防御機構について検討し,その効果を異なる展開シナリオで評価する。
論文 参考訳(メタデータ) (2025-06-26T22:02:01Z) - PandaGuard: Systematic Evaluation of LLM Safety against Jailbreaking Attacks [7.252454104194306]
大きな言語モデル(LLM)は目覚ましい能力を達成したが、ジェイルブレイクとして知られる敵のプロンプトに弱いままである。
LLMの安全性研究への取り組みが増えているにもかかわらず、既存の評価はしばしば断片化され、単独の攻撃や防御技術に焦点が当てられている。
PandaGuardはLLMジェイルブレイクの安全性を攻撃者、ディフェンダー、および審査員で構成されるマルチエージェントシステムとしてモデル化する、統一的でモジュール化されたフレームワークである。
論文 参考訳(メタデータ) (2025-05-20T03:14:57Z) - A Survey of Model Extraction Attacks and Defenses in Distributed Computing Environments [55.60375624503877]
モデル抽出攻撃(MEA)は、敵がモデルを盗み、知的財産と訓練データを公開することによって、現代の機械学習システムを脅かす。
この調査は、クラウド、エッジ、フェデレーションのユニークな特性がどのように攻撃ベクトルや防御要件を形作るのかを、緊急に理解する必要に起因している。
本研究は, 自動運転車, 医療, 金融サービスといった重要な分野において, 環境要因がセキュリティ戦略にどう影響するかを実証し, 攻撃手法と防衛機構の進化を系統的に検討する。
論文 参考訳(メタデータ) (2025-02-22T03:46:50Z) - Defenses in Adversarial Machine Learning: A Survey [46.41995115842852]
対立現象は機械学習(ML)システム、特にディープニューラルネットワークを用いたシステムで広く観測されている。
バックドア攻撃、重み攻撃、敵の例など、いくつかの先進的な攻撃パラダイムが探索するために開発されている。
対応する攻撃パラダイムに対するモデルロバスト性を改善するために、様々な防御パラダイムが開発されている。
この調査は、統一的な視点から、既存の防衛パラダイムの体系的なレビューを構築することを目的としている。
論文 参考訳(メタデータ) (2023-12-13T15:42:55Z) - Measuring Equality in Machine Learning Security Defenses: A Case Study
in Speech Recognition [56.69875958980474]
この研究は、学習したシステムを守るためのアプローチと、異なるサブ人口間でのセキュリティ防衛がパフォーマンス上の不平等をもたらす方法を検討する。
提案された多くの手法は、虚偽の拒絶やロバストネストレーニングの不平等といった直接的な害を引き起こす可能性がある。
本稿では, ランダム化スムースメントとニューラルリジェクションの2つの防御法の比較を行い, マイノリティ集団のサンプリング機構により, ランダム化スムースメントがより公平であることを見出した。
論文 参考訳(メタデータ) (2023-02-17T16:19:26Z) - Against All Odds: Winning the Defense Challenge in an Evasion
Competition with Diversification [13.236009846517662]
本稿では,Microsoft Evasion Competitionのディフェンダーチャレンジで最初に獲得した,学習ベースのPEberusについて概説する。
セマンティック・ギャップに対処し、様々な分類モデルを使用し、ステートフル・ディフェンスを適用する。
論文 参考訳(メタデータ) (2020-10-19T14:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。