論文の概要: Integrating Reward Maximization and Population Estimation: Sequential
Decision-Making for Internal Revenue Service Audit Selection
- arxiv url: http://arxiv.org/abs/2204.11910v1
- Date: Mon, 25 Apr 2022 18:28:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 15:22:09.043492
- Title: Integrating Reward Maximization and Population Estimation: Sequential
Decision-Making for Internal Revenue Service Audit Selection
- Title(参考訳): リワード最大化と人口推定の統合:内部歳入サービス監査のための逐次意思決定
- Authors: Peter Henderson, Ben Chugg, Brandon Anderson, Kristen Altenburger,
Alex Turk, John Guyton, Jacob Goldin, Daniel E. Ho
- Abstract要約: 我々は、新しい設定、最適化および推定された構造化バンディットを導入する。
この設定は多くの公共および民間分野のアプリケーションに固有のものである。
我々は、米国内国歳入庁の実際のデータにその重要性を示す。
- 参考スコア(独自算出の注目度): 2.2182596728059116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a new setting, optimize-and-estimate structured bandits. Here, a
policy must select a batch of arms, each characterized by its own context, that
would allow it to both maximize reward and maintain an accurate (ideally
unbiased) population estimate of the reward. This setting is inherent to many
public and private sector applications and often requires handling delayed
feedback, small data, and distribution shifts. We demonstrate its importance on
real data from the United States Internal Revenue Service (IRS). The IRS
performs yearly audits of the tax base. Two of its most important objectives
are to identify suspected misreporting and to estimate the "tax gap" - the
global difference between the amount paid and true amount owed. We cast these
two processes as a unified optimize-and-estimate structured bandit. We provide
a novel mechanism for unbiased population estimation that achieves rewards
comparable to baseline approaches. This approach has the potential to improve
audit efficacy, while maintaining policy-relevant estimates of the tax gap.
This has important social consequences given that the current tax gap is
estimated at nearly half a trillion dollars. We suggest that this problem
setting is fertile ground for further research and we highlight its interesting
challenges.
- Abstract(参考訳): 我々は,構造化バンディットを最適化し,評価する新しい設定を導入する。
ここでは、政策は、報酬を最大化し、その報酬の正確な(理想的には偏見のない)人口推定を維持するために、それぞれの状況によって特徴づけられる一連の武器を選択する必要がある。
この設定は、多くのパブリックおよびプライベートセクターアプリケーションに固有のものであり、しばしば遅延したフィードバック、小さなデータ、分散シフトを扱う必要がある。
我々は、米国内国歳入庁(IRS)の実際のデータにその重要性を示す。
IRSは毎年税制の監査を行っている。
その最も重要な目的の2つは、疑わしい報告を識別し、「税格差」を見積もることである。
これら2つのプロセスを統一された最適化と見積の構造化バンドとして配置しました。
基礎的アプローチに匹敵する報酬を得られる不偏人口推定のための新しいメカニズムを提供する。
このアプローチは、税収格差に関する政策関連の推定を維持しながら、監査効果を向上させる可能性がある。
これは、現在の税の格差がおよそ5兆ドルと見積もられていることから、社会的に重要な結果をもたらす。
我々は,この課題の設定はさらなる研究の場であり,その興味深い課題を浮き彫りにする。
関連論文リスト
- Learning Optimal Tax Design in Nonatomic Congestion Games [63.89699366726275]
我々は,非原子的混雑ゲームにおいて,最適な税制設計を学習し,効率を最大化する方法について検討する。
プレイヤー間の自己関心行動がシステムの効率を損なうことが知られている。
論文 参考訳(メタデータ) (2024-02-12T06:32:53Z) - Towards Validating Long-Term User Feedbacks in Interactive
Recommendation Systems [36.45966630580796]
対話型レコメンダシステム(IRS)は,ユーザとレコメンダシステム間の対話的プロセスをモデル化する能力から,多くの注目を集めている。
レビューデータセットを用いてIRSの実験を再考し、RLベースのモデルと単純な報酬モデルを比較した。
論文 参考訳(メタデータ) (2023-08-22T02:34:47Z) - Investigating the Robustness of Sequential Recommender Systems Against
Training Data Perturbations [9.463133630647569]
有限ランク付けに適した拡張された類似度であるFinite Rank-Biased Overlap (FRBO)を紹介する。
時間的に順序付けられたシーケンス内の異なる位置におけるアイテムの削除の影響を実験的に検討する。
その結果、シーケンスの最後にアイテムを削除することは、統計的にパフォーマンスに有意な影響を及ぼすことが示された。
論文 参考訳(メタデータ) (2023-07-24T23:26:46Z) - Best Arm Identification for Stochastic Rising Bandits [93.12525232849706]
Rising Bandits (SRBs) は、選択肢の期待される報酬が選択されるたびに増加する、シーケンシャルな意思決定の問題をモデル化する。
本稿では,SRBの固定予算ベストアーム識別(BAI)問題に焦点をあてる。
提案手法は,UCBライクなアプローチを取り入れたR-UCBEと,連続的なリジェクション手順を用いたR-SRという2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-15T08:01:37Z) - Entropy Regularization for Population Estimation [3.0175479520609887]
平均報酬推定タスクは、公共政策設定に不可欠であることが示されている。
エントロピーとKLのばらつきを活用することで、既存のベースラインよりも報酬と推定値のばらつきが良くなることを示す。
論文 参考訳(メタデータ) (2022-08-24T19:17:39Z) - Algorithmic Fairness and Vertical Equity: Income Fairness with IRS Tax
Audit Models [73.24381010980606]
本研究は、IRSによる税務監査選択を通知するシステムの文脈におけるアルゴリズムフェアネスの問題について検討する。
監査を選択するための柔軟な機械学習手法が、垂直エクイティにどのように影響するかを示す。
この結果は,公共セクター全体でのアルゴリズムツールの設計に影響を及ぼす。
論文 参考訳(メタデータ) (2022-06-20T16:27:06Z) - Confidence-Budget Matching for Sequential Budgeted Learning [69.77435313099366]
問合せ予算で意思決定問題を定式化する。
我々は,多腕バンディット,線形バンディット,強化学習問題を考察する。
我々は,CBMに基づくアルゴリズムが逆性の存在下で良好に動作することを示す。
論文 参考訳(メタデータ) (2021-02-05T19:56:31Z) - An Evolutionary Game Model for Understanding Fraud in Consumption Taxes [0.0]
本稿では,消費税制における不正ダイナミクスを研究・理解するための計算進化ゲームモデルを提案する。
プレイヤーは、付加価値税(VAT)を正しく申告し、それ以外の場合は、協力者です。
企業間の取引は買い手と売り手の両方が宣言しなければならないため、一方が採用する戦略は他方の支払いに影響を与える。
論文 参考訳(メタデータ) (2021-01-12T11:53:31Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。