論文の概要: Linear Model Extraction via Factual and Counterfactual Queries
- arxiv url: http://arxiv.org/abs/2602.09748v1
- Date: Tue, 10 Feb 2026 12:57:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.542078
- Title: Linear Model Extraction via Factual and Counterfactual Queries
- Title(参考訳): 実-実-実-実-実-実-実--による線形モデル抽出
- Authors: Daan Otto, Jannis Kurtz, Dick den Hertog, Ilker Birbil,
- Abstract要約: モデル抽出攻撃では、ブラックボックス機械学習モデルのパラメータを明らかにすることが目的である。
線形モデルと3種類のクエリについて検討する。
- 参考スコア(独自算出の注目度): 2.6499018693213316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In model extraction attacks, the goal is to reveal the parameters of a black-box machine learning model by querying the model for a selected set of data points. Due to an increasing demand for explanations, this may involve counterfactual queries besides the typically considered factual queries. In this work, we consider linear models and three types of queries: factual, counterfactual, and robust counterfactual. First, for an arbitrary set of queries, we derive novel mathematical formulations for the classification regions for which the decision of the unknown model is known, without recovering any of the model parameters. Second, we derive bounds on the number of queries needed to extract the model's parameters for (robust) counterfactual queries under arbitrary norm-based distances. We show that the full model can be recovered using just a single counterfactual query when differentiable distance measures are employed. In contrast, when using polyhedral distances for instance, the number of required queries grows linearly with the dimension of the data space. For robust counterfactuals, the latter number of queries doubles. Consequently, the applied distance function and robustness of counterfactuals have a significant impact on the model's security.
- Abstract(参考訳): モデル抽出攻撃では、選択したデータポイントの集合に対してモデルをクエリすることで、ブラックボックス機械学習モデルのパラメータを明らかにすることが目的である。
説明の要求が高まっているため、これは典型的に検討される事実クエリ以外に、偽のクエリを含む可能性がある。
本研究では,線形モデルと3種類のクエリについて考察する。
まず、任意のクエリの集合に対して、未知のモデルの決定が知られている分類領域に対して、モデルのパラメータを復元することなく、新しい数学的定式化を導出する。
第2に、任意のノルムベース距離下での(ロバストな)逆ファクトクエリに対して、モデルのパラメータを抽出するために必要なクエリ数に基づいて境界を導出する。
そこで本研究では, 差分距離測定を行う場合, 単一対実的なクエリを用いて, モデル全体を復元可能であることを示す。
対照的に、例えば多面体距離を使用する場合、要求されるクエリの数はデータ空間の次元と線形に増加する。
堅牢なカウンターファクトに対して、後者のクエリ数は倍になる。
その結果,有効距離関数と反ファクトのロバスト性はモデルの安全性に大きな影響を及ぼすことがわかった。
関連論文リスト
- HuggingR$^{4}$: A Progressive Reasoning Framework for Discovering Optimal Model Companions [50.61510609116118]
HuggingR$4$は、Reasoning、Retrieval、Refinement、Reflectionを組み合わせて効率的にモデルを選択する新しいフレームワークである。
作業性率は92.03%、理性率は82.46%に達し、それぞれ26.51%、33.25%を超える。
論文 参考訳(メタデータ) (2025-11-24T03:13:45Z) - From Black-box to Causal-box: Towards Building More Interpretable Models [57.23201263629627]
本稿では, 因果解釈可能性の概念を導入し, 特定のモデルのクラスから対実的クエリを評価できるときの形式化について述べる。
我々は、与えられたモデルアーキテクチャが与えられた偽物クエリをサポートするかどうかを決定する完全なグラフィカルな基準を導出する。
論文 参考訳(メタデータ) (2025-10-24T20:03:18Z) - Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。
本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。
RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文 参考訳(メタデータ) (2025-09-29T01:40:26Z) - Exploring Query Efficient Data Generation towards Data-free Model Stealing in Hard Label Setting [38.755154033324374]
データフリーモデルは、ターゲットモデルの構造、パラメータ、トレーニングデータにアクセスすることなく、ターゲットモデルの機能を代替モデルに複製する。
本稿では Query Efficient Data Generation (textbfQEDG) と呼ばれる新しいデータフリーモデルステーリング手法を提案する。
対象モデルの決定境界に密接に一様に整合する十分なサンプルの生成を保証するために、2つの異なる損失関数を導入する。
論文 参考訳(メタデータ) (2024-12-18T03:03:15Z) - FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning [12.894941192080616]
FormulaReasoningは、式ベースの数値推論用に特別に設計された新しいデータセットである。
5,324の質問からなり、外部物理式に基礎を置く数値計算を必要とする。
フォーミュラ推論における様々な推論手法を解析し、異なるアーキテクチャおよび方法論のフレームワークの比較評価に重点を置いている。
論文 参考訳(メタデータ) (2024-02-20T03:39:49Z) - Predictive Querying for Autoregressive Neural Sequence Models [23.85426261235507]
本稿では,ニューラル自己回帰シーケンスモデルにおける予測クエリの汎用型について紹介する。
このようなクエリは,基本構造ブロックの集合によって体系的に表現可能であることを示す。
我々はこの型を利用して新しいクエリ推定手法を開発した。
論文 参考訳(メタデータ) (2022-10-12T17:59:36Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - When Can Models Learn From Explanations? A Formal Framework for
Understanding the Roles of Explanation Data [84.87772675171412]
個々のデータポイントの説明がモデリング性能を向上させる状況について検討する。
e-SNLI、TACRED、SemEvalの3つの既存のデータセットを使って説明します。
論文 参考訳(メタデータ) (2021-02-03T18:57:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。