論文の概要: Automated Membership Inference Attacks: Discovering MIA Signal Computations using LLM Agents
- arxiv url: http://arxiv.org/abs/2603.19375v1
- Date: Thu, 19 Mar 2026 18:10:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.83386
- Title: Automated Membership Inference Attacks: Discovering MIA Signal Computations using LLM Agents
- Title(参考訳): 自動メンバシップ推論攻撃: LLMエージェントを用いたMIA信号計算の発見
- Authors: Toan Tran, Olivera Kotevska, Li Xiong,
- Abstract要約: メンバーシップ推論攻撃(MIA)は、特定のデータポイントがモデルのトレーニングデータセットの一部であるかどうかを敵が判断することを可能にする。
我々は,大規模言語モデル(LLM)エージェントを利用した新しいフレームワークであるAutoMIAを紹介し,新しいMIA信号計算の設計と実装を自動化する。
AutoMIAは、ユーザが設定したターゲットモデルとデータセットに特化された新しいMIAを正常に見つけることができる。
- 参考スコア(独自算出の注目度): 7.274076229451189
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Membership inference attacks (MIAs), which enable adversaries to determine whether specific data points were part of a model's training dataset, have emerged as an important framework to understand, assess, and quantify the potential information leakage associated with machine learning systems. Designing effective MIAs is a challenging task that usually requires extensive manual exploration of model behaviors to identify potential vulnerabilities. In this paper, we introduce AutoMIA -- a novel framework that leverages large language model (LLM) agents to automate the design and implementation of new MIA signal computations. By utilizing LLM agents, we can systematically explore a vast space of potential attack strategies, enabling the discovery of novel strategies. Our experiments demonstrate AutoMIA can successfully discover new MIAs that are specifically tailored to user-configured target model and dataset, resulting in improvements of up to 0.18 in absolute AUC over existing MIAs. This work provides the first demonstration that LLM agents can serve as an effective and scalable paradigm for designing and implementing MIAs with SOTA performance, opening up new avenues for future exploration.
- Abstract(参考訳): 特定のデータポイントがモデルのトレーニングデータセットの一部であるかどうかを判断できるメンバーシップ推論攻撃(MIA)が、マシンラーニングシステムに関連する潜在的な情報漏洩を理解し、評価し、定量化するための重要なフレームワークとして登場した。
効果的なMIAを設計するには、潜在的な脆弱性を特定するために、モデル動作を広範囲に手動で調査する必要がある。
本稿では,新たなMIA信号計算の設計と実装を自動化するために,大規模言語モデル(LLM)エージェントを利用する新しいフレームワークであるAutoMIAを紹介する。
LLMエージェントを利用することで、潜在的攻撃戦略の広大な空間を体系的に探索し、新たな戦略の発見を可能にする。
我々の実験は、ユーザが設定したターゲットモデルとデータセットに特化された新しいMIAをAutoMIAが発見できることを示し、その結果、既存のMIAよりも最大0.18の絶対AUCが改善された。
この研究は、LSMエージェントがSOTAパフォーマンスでMIAを設計、実装するための効果的でスケーラブルなパラダイムとして機能し、将来の探索のための新たな道を開く最初のデモンストレーションを提供する。
関連論文リスト
- AttenMIA: LLM Membership Inference Attack through Attention Signals [8.170623979629953]
我々は,変圧器モデル内部の自己注意パターンを利用してメンバシップを推定する新しいMIAフレームワークであるAttenMIAを紹介する。
注意に基づく特徴は、特に重要な低偽陽性尺度の下で、一貫してベースラインを上回ります。
また,データ抽出フレームワークにおける他のメンバシップ推論攻撃を置き換えるためにAttenMIAを用いることで,技術状況よりも優れたデータ抽出攻撃を訓練できることを示す。
論文 参考訳(メタデータ) (2026-01-26T03:45:56Z) - Multi-Agent Collaborative Intrusion Detection for Low-Altitude Economy IoT: An LLM-Enhanced Agentic AI Framework [60.72591149679355]
低高度経済の急速な拡大により、インターネット・オブ・モノ(LAE-IoT)ネットワークは前例のないセキュリティ上の課題を生んだ。
従来の侵入検知システムは、空中IoT環境のユニークな特徴に対処できない。
LAE-IoTネットワークにおける侵入検出を強化するための大規模言語モデル(LLM)対応エージェントAIフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-25T12:47:25Z) - EL-MIA: Quantifying Membership Inference Risks of Sensitive Entities in LLMs [10.566053894405902]
我々は,LLMプライバシの文脈において,機密情報に着目した会員リスクのエンティティレベル発見という新たな課題を提案する。
既存のMIAの方法は、LLMトレーニングデータにすべてのプロンプトや文書が存在することを検知できるが、より細かい粒度でリスクを捕捉できない。
本研究では,MIA手法の評価のためのベンチマークデータセットを構築した。
論文 参考訳(メタデータ) (2025-10-31T18:50:47Z) - Detecting Training Data of Large Language Models via Expectation Maximization [62.28028046993391]
本稿では,予測最大化アルゴリズムを用いて,メンバーシップスコアとプレフィックススコアを反復的に洗練する新しいメンバーシップ推論手法EM-MIAを紹介する。
EM-MIAはWikiMIAで最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-10T03:31:16Z) - MIA-Tuner: Adapting Large Language Models as Pre-training Text Detector [32.15773300068426]
既存の手法では、様々な高度なMIAスコア関数を設計し、高い検出性能を実現している。
より正確な事前学習データ検出器としてLLM自体を指示する命令ベースのMIA手法であるMIA-Tunerを提案する。
既存の手法とMIA-Tunerによってもたらされるプライバシーリスクを軽減すべく、2つの命令ベースのセーフガードを設計する。
論文 参考訳(メタデータ) (2024-08-16T11:09:56Z) - AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models [95.09157454599605]
大規模言語モデル(LLM)はますます強力になってきていますが、それでも顕著ですが微妙な弱点があります。
従来のベンチマークアプローチでは、特定のモデルの欠陥を徹底的に特定することはできない。
さまざまなタスクにまたがるLLMの弱点を自動的に露呈する統合フレームワークであるAutoDetectを導入する。
論文 参考訳(メタデータ) (2024-06-24T15:16:45Z) - Towards Modeling Learner Performance with Large Language Models [7.002923425715133]
本稿では,LLMのパターン認識とシーケンスモデリング機能が,知識追跡の領域にまで拡張できるかどうかを検討する。
ゼロショットプロンプト(ゼロショットプロンプト)とモデル微調整(モデル微調整)の2つの手法と,既存のLLM以外の知識追跡手法を比較した。
LLMベースのアプローチは最先端のパフォーマンスを達成しないが、微調整のLLMは素早いベースラインモデルの性能を上回り、標準的なベイズ的知識追跡手法と同等に機能する。
論文 参考訳(メタデータ) (2024-02-29T14:06:34Z) - On Fast Adversarial Robustness Adaptation in Model-Agnostic
Meta-Learning [100.14809391594109]
モデルに依存しないメタラーニング(MAML)は、数発の学習において最も成功したメタラーニング手法の1つである。
メタモデルの一般化力にもかかわらず、マルチショット学習においてMDLがいかに敵対的堅牢性を維持することができるかは明らかではない。
本稿では,ラベルなしデータ拡張,高速な攻撃生成,計算量軽微な微調整を可能にする,汎用的かつ最適化が容易なロバストネス正規化メタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-20T22:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。