論文の概要: Strategic Classification with Randomised Classifiers
- arxiv url: http://arxiv.org/abs/2502.01313v1
- Date: Mon, 03 Feb 2025 12:41:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:03:59.754847
- Title: Strategic Classification with Randomised Classifiers
- Title(参考訳): ランダム化分類器を用いた戦略分類
- Authors: Jack Geary, Henry Gouk,
- Abstract要約: 戦略的分類の問題は、学習者が戦略的に修正された特徴に基づいてエージェントを分類するモデルを構築する必要がある。
特定の条件下では、最適ランダム化分類器は最適な決定論的分類器よりも精度が高いことを示す。
我々は、ランダム化は、実質的な欠点を導入することなく、実際に直面する可能性のある問題を緩和する可能性があると結論付けている。
- 参考スコア(独自算出の注目度): 11.732535996238003
- License:
- Abstract: We consider the problem of strategic classification, where a learner must build a model to classify agents based on features that have been strategically modified. Previous work in this area has concentrated on the case when the learner is restricted to deterministic classifiers. In contrast, we perform a theoretical analysis of an extension to this setting that allows the learner to produce a randomised classifier. We show that, under certain conditions, the optimal randomised classifier can achieve better accuracy than the optimal deterministic classifier, but under no conditions can it be worse. When a finite set of training data is available, we show that the excess risk of Strategic Empirical Risk Minimisation over the class of randomised classifiers is bounded in a similar manner as the deterministic case. In both the deterministic and randomised cases, the risk of the classifier produced by the learner converges to that of the corresponding optimal classifier as the volume of available training data grows. Moreover, this convergence happens at the same rate as in the i.i.d. case. Our findings are compared with previous theoretical work analysing the problem of strategic classification. We conclude that randomisation has the potential to alleviate some issues that could be faced in practice without introducing any substantial downsides.
- Abstract(参考訳): 戦略的分類の問題は、学習者が戦略的に修正された特徴に基づいてエージェントを分類するモデルを構築する必要がある。
この領域の先行研究は、学習者が決定論的分類器に制限された場合に集中している。
対照的に、この設定の拡張に関する理論的解析を行い、学習者がランダム化された分類器を作成できるようにする。
特定の条件下では、最適ランダム化分類器は最適な決定論的分類器よりも精度が良いが、条件がなければより悪くなることを示す。
学習データの有限セットが利用できる場合、ランダム化分類器のクラスに対する戦略的経験的リスク最小化の余剰リスクは決定論的ケースと同様の方法で有界であることを示す。
決定論的かつランダムな場合の両方において、学習者が生成する分類器のリスクは、利用可能なトレーニングデータのボリュームが増加するにつれて、対応する最適分類器のそれと収束する。
さらに、この収束はi.d.の場合と同じ速度で起こる。
本研究は,戦略分類の問題を分析する従来の理論的研究と比較した。
我々は、ランダム化は、実質的な欠点を導入することなく、実際に直面する可能性のある問題を緩和する可能性があると結論付けている。
関連論文リスト
- Teaching Models To Survive: Proper Scoring Rule and Stochastic Optimization with Competing Risks [6.9648613217501705]
データが正しい検閲された場合、サバイバル分析は「イベントの時間」を計算することができる。
我々は,データの部分に対して最適化可能な,厳格に適切な検閲調整付き分離可能なスコアリングルールを導入する。
11の最先端モデルと比較して、このモデルであるMulti Incidenceは、生存率と競合するリスクの確率を推定するのに最適である。
論文 参考訳(メタデータ) (2024-06-20T08:00:42Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Characterizing the Optimal 0-1 Loss for Multi-class Classification with
a Test-time Attacker [57.49330031751386]
我々は,任意の離散データセット上の複数クラス分類器に対するテスト時間攻撃の存在下での損失に対する情報理論的下位境界を求める。
本稿では,データと敵対的制約から競合ハイパーグラフを構築する際に発生する最適0-1損失を求めるための一般的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-02-21T15:17:13Z) - On the Role of Randomization in Adversarially Robust Classification [13.39932522722395]
ランダムなアンサンブルは、敵のリスクに設定された仮説より優れていることを示す。
また、そのような決定論的分類器を含む決定論的仮説セットを明示的に記述する。
論文 参考訳(メタデータ) (2023-02-14T17:51:00Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Scalable Optimal Classifiers for Adversarial Settings under Uncertainty [10.90668635921398]
本稿では,攻撃者に対して目的が不明な攻撃者がクラス-1データを生成する対角的設定において,最適な分類器を見つけることの問題点を考察する。
この低次元キャラクタリゼーションにより,ほぼほぼ最適な分類器をスケーラブルに計算する訓練手法が開発可能であることを示す。
論文 参考訳(メタデータ) (2021-06-28T13:33:53Z) - The Role of Randomness and Noise in Strategic Classification [7.972516140165492]
戦略的分類設定における最適分類器の設計問題について検討する。
多くの自然の場合において、与えられた最適解はプレイヤーが特徴ベクトルを決して変更しない構造を持つことを示す。
また、ノイズ信号が平衡結果を改善することも示している。
論文 参考訳(メタデータ) (2020-05-17T21:49:41Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z) - Fairness Measures for Regression via Probabilistic Classification [0.0]
アルゴリズムフェアネス(英: Algorithmic Fairness)とは、機械学習アルゴリズムが最適化できる定量尺度として、公平性や合理的な扱いなどの概念を表現することである。
これは、分類公正度尺度が結果の比率を比較することで容易に計算され、同じ資格を持つ男性の割合が適格女性として選択されるような行動につながるためである。
しかし、そのような尺度は、価格や支払いの割当といった問題に対する継続的な回帰設定を一般化することは、計算的に困難である。
回帰設定では, 保護属性の異なる条件確率の比率として, 独立性, 分離性, 充足性基準の抽出可能な近似を導入する。
論文 参考訳(メタデータ) (2020-01-16T21:53:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。