Fugu-MT 論文翻訳(概要): One-Shot Strategic Classification Under Unknown Costs

論文の概要: One-Shot Strategic Classification Under Unknown Costs

arxiv url: http://arxiv.org/abs/2311.02761v1
Date: Sun, 5 Nov 2023 20:43:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-07 16:03:48.614959
Title: One-Shot Strategic Classification Under Unknown Costs
Title（参考訳）: 未知のコストによるワンショット戦略分類
Authors: Elan Rosenfeld, Nir Rosenfeld
Abstract要約: 分類の第一の目的は、戦略的入力に対して堅牢な決定ルールを学ぶことである。不確実性の原因として,ユーザのコスト関数に注目した。分析の結果,戦略的ユーザの反応から生じる重要な構造が明らかになった。
参考スコア（独自算出の注目度）: 22.907341026741026
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A primary goal in strategic classification is to learn decision rules which are robust to strategic input manipulation. Earlier works assume that strategic responses are known; while some recent works address the important challenge of unknown responses, they exclusively study sequential settings which allow multiple model deployments over time. But there are many domains$\unicode{x2014}$particularly in public policy, a common motivating use-case$\unicode{x2014}$where multiple deployments are unrealistic, or where even a single bad round is undesirable. To address this gap, we initiate the study of strategic classification under unknown responses in the one-shot setting, which requires committing to a single classifier once. Focusing on the users' cost function as the source of uncertainty, we begin by proving that for a broad class of costs, even a small mis-estimation of the true cost can entail arbitrarily low accuracy in the worst case. In light of this, we frame the one-shot task as a minimax problem, with the goal of identifying the classifier with the smallest worst-case risk over an uncertainty set of possible costs. Our main contribution is efficient algorithms for both the full-batch and stochastic settings, which we prove converge (offline) to the minimax optimal solution at the dimension-independent rate of $\tilde{\mathcal{O}}(T^{-\frac{1}{2}})$. Our analysis reveals important structure stemming from the strategic nature of user responses, particularly the importance of dual norm regularization with respect to the cost function.
Abstract（参考訳）: 戦略的分類の主要な目標は、戦略的な入力操作にロバストな決定ルールを学ぶことである。いくつかの最近の研究は未知の応答の重要な課題に対処しているが、彼らは時間とともに複数のモデル展開を可能にするシーケンシャルな設定のみを研究している。しかし、パブリックポリシーでは、多くのドメインがある:$\unicode{x2014}$ 特に、共通のモチベーションのユースケース$\unicode{x2014}$複数のデプロイメントが非現実的である、あるいは単一の悪いラウンドでさえ望ましくない。このギャップに対処するため,我々は,単一分類子に一度コミットする必要がある一発設定において,未知の応答下での戦略的分類の研究を開始する。不確実性の発生源としてのユーザのコスト関数に着目して、幅広いコストクラスにおいて、たとえ真コストの小さな誤評価であっても、最悪の場合、任意に低い精度が伴うことを証明し始める。これを踏まえて、一発タスクを最小限の問題とみなし、可能なコストの不確実性セットに対して最小の最悪のリスクを持つ分類器を特定することを目的としている。我々の主な貢献は、全バッチおよび確率的設定の両方に対する効率的なアルゴリズムであり、これは、$\tilde{\mathcal{O}}(T^{-\frac{1}{2}})$の次元非依存速度でミニマックス最適解に収束する(オフライン)ことを証明している。分析の結果,ユーザ応答の戦略的性質,特にコスト関数に対する二重規範正規化の重要性に起因する重要な構造が明らかになった。

関連論文リスト

Optimal Sample Complexity for Single Time-Scale Actor-Critic with Momentum [62.691095807959215]
我々は,シングルタイムスケールアクター・クリティック(AC)アルゴリズムを用いて,$O(-2)$の最適なグローバルポリシを得るための最適なサンプル複雑性を確立する。これらのメカニズムは、既存のディープラーニングアーキテクチャと互換性があり、実用的な適用性を損なうことなく、小さな修正しか必要としない。
論文参考訳（メタデータ） (2026-02-02T00:35:42Z)
Rewriting the Budget: A General Framework for Black-Box Attacks Under Cost Asymmetry [11.292557925135283]
非対称なクエリコストで決定に基づく攻撃を行うための一般的なフレームワークを提案する。異なるクエリタイプのバランスをとることで、総攻撃コストを最小限に抑える効率的なアルゴリズムを設計する。提案手法は,既存手法に比べてクエリコストを一貫して低減し,摂動を小さくする。
論文参考訳（メタデータ） (2025-06-07T22:02:27Z)
T$^2$: An Adaptive Test-Time Scaling Strategy for Contextual Question Answering [49.5489716597489]
T$2$: Think-to-Thinkは質問の複雑さに基づいて推論深度を動的に適応する新しいフレームワークである。 T$2$は、質問を構造的要素に分解し、候補推論戦略と同じような例を生成し、これらの戦略を複数の基準に対して評価し、元の質問に最も適切な戦略を適用する、という4つの重要なステップで機能する。
論文参考訳（メタデータ） (2025-05-23T03:18:02Z)
Learning While Repositioning in On-Demand Vehicle Sharing Networks [4.724825031148413]
我々は、一方通行のオンデマンド車両共有サービスによるネットワーク在庫問題を考える。自然なリプシッツ帯域法が$widetildeO(Tfracnn+1)$の後悔の保証を達成できることを示し、これは$n$に対する指数的依存に悩まされる。これらの課題に乗じて、検閲された需要のみに依存するオンライン・グラディエント・リポジション・アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-01-31T15:16:02Z)
Settling the Sample Complexity of Online Reinforcement Learning [92.02082223856479]
バーンインコストを発生させることなく、最小限の最適後悔を実現する方法を示す。最適値/コストや一定の分散といった問題依存量の影響を明らかにするために、我々の理論を拡張します。
論文参考訳（メタデータ） (2023-07-25T15:42:11Z)
Quantization for decentralized learning under subspace constraints [61.59416703323886]
エージェントがサブスペース制約を最小化するために個々のコスト関数を持つ分散最適化問題を考察する。本稿では,エージェントが確率化量子化器を用いて推定値を圧縮する適応分散型戦略を提案し,検討する。この分析は、量子化ノイズのいくつかの一般的な条件下では、平均二乗誤差と平均ビットレートの両方で戦略が安定であることを示している。
論文参考訳（メタデータ） (2022-09-16T09:38:38Z)
Online Selective Classification with Limited Feedback [82.68009460301585]
オンライン学習モデルにおいて、予測者がインスタンスの分類を控える可能性のある選択的分類について検討する。私たちが考慮している設定の健全な2つの側面は、データが不可避である可能性があるため、データは不可避である可能性があるということです。 smash$tildeO(T1-mu)$ over abstention against Adaptive adversaries. smash$tildeO(T1-mu)$ incurring smash$tildeO(T1-mu)$ over abstention。
論文参考訳（メタデータ） (2021-10-27T08:00:53Z)
Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文参考訳（メタデータ） (2021-06-05T09:16:28Z)
Learning with User-Level Privacy [61.62978104304273]
ユーザレベルの差分プライバシー制約下での学習課題を,アルゴリズムを用いて解析する。個々のサンプルのプライバシーのみを保証するのではなく、ユーザレベルのdpはユーザの貢献全体を保護します。プライバシコストが$tau$に比例した$K$適応的に選択されたクエリのシーケンスにプライベートに答えるアルゴリズムを導き出し、私たちが検討する学習タスクを解決するためにそれを適用します。
論文参考訳（メタデータ） (2021-02-23T18:25:13Z)
Minimax Regret for Stochastic Shortest Path with Adversarial Costs and Known Transition [37.6975819766632]
我々は、敵対コストと既知の移行で最短経路問題を研究します。ミニマックスの後悔は,全情報設定と盗聴フィードバック設定に対して$widetildeO(sqrtDTstar K)$および$widetildeO(sqrtDTstar SA K)$であることを示す。
論文参考訳（メタデータ） (2020-12-07T20:55:28Z)
Nearly Dimension-Independent Sparse Linear Bandit over Small Action Spaces via Best Subset Selection [71.9765117768556]
本研究では,高次元線形モデルの下での文脈的帯域問題について考察する。この設定は、パーソナライズされたレコメンデーション、オンライン広告、パーソナライズされた医療など、不可欠な応用を見出す。本稿では,最適部分集合選択法を用いて2重成長エポックを推定する手法を提案する。
論文参考訳（メタデータ） (2020-09-04T04:10:39Z)
Minimum discrepancy principle strategy for choosing $k$ in $k$-NN regression [2.0411082897313984]
保持データを用いずに、$k$-NN回帰推定器でハイパーパラメータ$k$を選択するための新しいデータ駆動戦略を提案する。本稿では,早期停止と最小一致原理に基づく実践的戦略を実践的に容易に導入することを提案する。
論文参考訳（メタデータ） (2020-08-20T00:13:19Z)
Estimating Principal Components under Adversarial Perturbations [25.778123431786653]
本研究では,高次元統計的推定問題に対するロバストネスの自然なモデルについて検討する。我々のモデルは、低精度機械学習や対人訓練といった新しいパラダイムによって動機付けられている。
論文参考訳（メタデータ） (2020-05-31T20:27:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。