論文の概要: Sequential Strategic Classification with Multi-Stage Selective Classifiers
- arxiv url: http://arxiv.org/abs/2605.04202v1
- Date: Tue, 05 May 2026 18:42:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.490061
- Title: Sequential Strategic Classification with Multi-Stage Selective Classifiers
- Title(参考訳): 多段階選択型分類器を用いた逐次戦略分類
- Authors: Ziyuan Huang, Lina Alkarmi, Mingyan Liu,
- Abstract要約: 自己関心のある個人やエージェントが、適切な意思決定結果を得るために、その反応を操作できる問題について検討する。
以前の研究は、分類器の設計にのみ焦点をあてることによって、この難問から抜け出すという根本的な障害を実証してきた。
本稿では,エージェントが行動にどう適応するかを捉えることによって,戦略的分類の逐次的多段階モデルを提案する。
- 参考スコア(独自算出の注目度): 11.395181681423892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Strategic classification studies the problem where self-interested individuals or agents manipulate their response to obtain favorable decision outcomes made by classifiers, typically turning to dishonest actions when they are less costly than genuine efforts. Prior works have demonstrated a fundamental inability to get out of this conundrum by only focusing on the design of a classifier. We note that prior work also heavily focuses on either one-shot settings or repeated interaction with the same classifier. Real-world decision making is often multi-stage, involving a sequence of potentially different classifiers as an agent progresses. This paper introduces a sequential, stochastic, multi-stage model of strategic classification, by capturing how agents adapt their behavior, through improvement actions (enhancing both observable features and true attributes) and gaming actions (enhancing only observable features), over multiple levels of classification with increasing difficulty as well as reward. For each level, we adopt a selective classifier that can abstain from making a prediction at low confidence. Consequently, a positive (resp. negative) outcome leads to promotion (resp. demotion) of the agent to the next higher (resp. lower) level, while abstention keeps the agent at the same level. We fully characterize the agent's optimal instantaneous action under selective classifiers and compare the long-term properties and utility of the agent repeatedly following an optimal myopic policy of either no-improvement (never choose the improvement action) or no-gaming (never choose the gaming action). We further examine design principles over the sequence of classifiers that yield higher long-term utility for the latter policy, thereby effectively incentivizing genuine effort in the long run.
- Abstract(参考訳): 戦略分類は、自己関心のある個人やエージェントが反応を操り、分類者によってなされる好ましい決定結果を得るという問題を研究する。
以前の研究は、分類器の設計にのみ焦点をあてることによって、この難問から抜け出すという根本的な障害を実証してきた。
以前の作業では、ワンショット設定や同じ分類器との繰り返し操作にも重点を置いています。
実世界の意思決定はしばしば多段階的であり、エージェントが進行するにつれて、潜在的に異なる分類器のシーケンスを含む。
本稿では,多段階の戦略分類モデルを導入し,エージェントの行動適応の仕方,改善行動(観測可能な特徴と真の属性の両方を強調)とゲーム行動(観測可能な特徴のみを強調)を,難易度と報奨度を増し,多段階にわたる分類モデルを提案する。
各レベルに対して、信頼性の低い予測を控える選択型分類器を採用する。
その結果、正の(負の)結果が、エージェントの次の上位(下降の)レベルへの昇格(後退の)につながる一方、禁忌はエージェントを同じレベルに維持する。
選択分類器の下では,エージェントの最適瞬間動作を特徴付けるとともに,改善動作を選択しない場合,ゲーム動作を選択しない場合,改善動作を選択しない場合)の最適筋電図ポリシーに従って,エージェントの長期的特性と有用性を繰り返し比較する。
さらに、後者の政策に対してより長期的効用をもたらす分類器の順序に関する設計原則について検討し、これにより、長期的に真の努力を効果的にインセンティブする。
関連論文リスト
- Multi-Level Strategic Classification: Incentivizing Improvement through Promotion and Relegation Dynamics [11.395181681423892]
自己関心のある個人やエージェントが、適切な意思決定結果を得るために、その反応を操作できる問題について検討する。
本モデルでは, エージェントの注意力, スキル保持力, および, 能力と達成能力が自己強化できる脚上げ効果によって引き起こされる時間的インセンティブを, 時間的インセンティブとして捉えた。
軽微な条件下では、エージェントは真の改善努力のみで任意に高いレベルに達することができることを実証する。
論文 参考訳(メタデータ) (2026-02-11T23:35:21Z) - When In Doubt, Abstain: The Impact of Abstention on Strategic Classification [11.395181681423892]
本稿では,戦略的分類の文脈における棄権について検討する。
最適な棄権は、主観的効用が非棄権的条件よりも悪くないことを保証することを示す。
また、禁忌は操作の抑止力としても機能し、操作するエージェントがポジティブな結果を得るのにコストがかかることも示している。
論文 参考訳(メタデータ) (2025-10-15T09:13:44Z) - Strategic Classification With Externalities [11.36782598786846]
戦略分類問題の新しい変種を提案する。
実世界のアプリケーションによって動機づけられた我々のモデルは、あるエージェントの操作が他のエージェントに影響を与えることを決定的に許している。
特定の仮定の下では、このエージェント操作ゲームの純粋なナッシュ平衡はユニークであり、効率的に計算できることが示される。
論文 参考訳(メタデータ) (2024-10-10T15:28:04Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - Inferring Lexicographically-Ordered Rewards from Preferences [82.42854687952115]
本稿では,エージェントの観察された嗜好の多目的報酬に基づく表現を推定する手法を提案する。
我々は,異なる目的に対するエージェントの優先順位を語彙的入力としてモデル化することにより,エージェントがより高い優先順位を持つ目的に対して無関心である場合に限って,より低い優先順位を持つ目的が重要となるようにした。
論文 参考訳(メタデータ) (2022-02-21T12:01:41Z) - Randomized Entity-wise Factorization for Multi-Agent Reinforcement
Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。
我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文 参考訳(メタデータ) (2020-06-07T18:28:41Z) - Incentivizing Exploration with Selective Data Disclosure [70.11902902106014]
効率的な探索を促すレコメンデーションシステムを提案し設計する。
エージェントは順次到着し、固定されたが未知のアクション固有の分布から引き出されたアクションを選択し、報酬を受け取る。
フレキシブル・頻繁な行動モデルを用いた探索において,最適な後悔率が得られる。
論文 参考訳(メタデータ) (2018-11-14T19:29:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。