Fugu-MT 論文翻訳(概要): Integrating Reward Maximization and Population Estimation: Sequential Decision-Making for Internal Revenue Service Audit Selection

論文の概要: Integrating Reward Maximization and Population Estimation: Sequential Decision-Making for Internal Revenue Service Audit Selection

arxiv url: http://arxiv.org/abs/2204.11910v1
Date: Mon, 25 Apr 2022 18:28:55 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-27 15:22:09.043492
Title: Integrating Reward Maximization and Population Estimation: Sequential Decision-Making for Internal Revenue Service Audit Selection
Title（参考訳）: リワード最大化と人口推定の統合:内部歳入サービス監査のための逐次意思決定
Authors: Peter Henderson, Ben Chugg, Brandon Anderson, Kristen Altenburger, Alex Turk, John Guyton, Jacob Goldin, Daniel E. Ho
Abstract要約: 我々は、新しい設定、最適化および推定された構造化バンディットを導入する。この設定は多くの公共および民間分野のアプリケーションに固有のものである。我々は、米国内国歳入庁の実際のデータにその重要性を示す。
参考スコア（独自算出の注目度）: 2.2182596728059116
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce a new setting, optimize-and-estimate structured bandits. Here, a policy must select a batch of arms, each characterized by its own context, that would allow it to both maximize reward and maintain an accurate (ideally unbiased) population estimate of the reward. This setting is inherent to many public and private sector applications and often requires handling delayed feedback, small data, and distribution shifts. We demonstrate its importance on real data from the United States Internal Revenue Service (IRS). The IRS performs yearly audits of the tax base. Two of its most important objectives are to identify suspected misreporting and to estimate the "tax gap" - the global difference between the amount paid and true amount owed. We cast these two processes as a unified optimize-and-estimate structured bandit. We provide a novel mechanism for unbiased population estimation that achieves rewards comparable to baseline approaches. This approach has the potential to improve audit efficacy, while maintaining policy-relevant estimates of the tax gap. This has important social consequences given that the current tax gap is estimated at nearly half a trillion dollars. We suggest that this problem setting is fertile ground for further research and we highlight its interesting challenges.
Abstract（参考訳）: 我々は,構造化バンディットを最適化し,評価する新しい設定を導入する。ここでは、政策は、報酬を最大化し、その報酬の正確な(理想的には偏見のない)人口推定を維持するために、それぞれの状況によって特徴づけられる一連の武器を選択する必要がある。この設定は、多くのパブリックおよびプライベートセクターアプリケーションに固有のものであり、しばしば遅延したフィードバック、小さなデータ、分散シフトを扱う必要がある。我々は、米国内国歳入庁(IRS)の実際のデータにその重要性を示す。 IRSは毎年税制の監査を行っている。その最も重要な目的の2つは、疑わしい報告を識別し、「税格差」を見積もることである。これら2つのプロセスを統一された最適化と見積の構造化バンドとして配置しました。基礎的アプローチに匹敵する報酬を得られる不偏人口推定のための新しいメカニズムを提供する。このアプローチは、税収格差に関する政策関連の推定を維持しながら、監査効果を向上させる可能性がある。これは、現在の税の格差がおよそ5兆ドルと見積もられていることから、社会的に重要な結果をもたらす。我々は,この課題の設定はさらなる研究の場であり,その興味深い課題を浮き彫りにする。

関連論文リスト

Position: The Hidden Costs and Measurement Gaps of Reinforcement Learning with Verifiable Rewards [110.47944672736723]
我々は、RLVR税、評価落とし穴、データ汚染という3つの力によって利回りが過大評価されることが多いと論じている。本稿では, 精度, グラウンド, キャリブレーションを両立させる税意識訓練・評価プロトコルを提案する。
論文参考訳（メタデータ） (2025-09-26T05:06:25Z)
Language Models and Logic Programs for Trustworthy Financial Reasoning [50.73061215297832]
税の申告には複雑な推論が必要であり、重複ルールの適用と数値計算を組み合わせる必要がある。そこで我々は,LLMを象徴的解決器と統合して納税義務を計算する手法を提案する。本稿では, 形式論理プログラムの事前翻訳と, 形式論理表現の知的検索例を組み合わせることで, 性能が劇的に向上することを示す。
論文参考訳（メタデータ） (2025-08-28T17:55:07Z)
TaxAgent: How Large Language Model Designs Fiscal Policy [22.859190941594296]
本研究では,大規模言語モデル(LLM)とエージェントベースモデリング(ABM)を統合し,適応型税制を設計するTaxAgentを紹介する。我々のマクロ経済シミュレーションでは、ヘテロジニアスなH-Agents(ハウスホールディングス)が現実の納税者の振る舞いをシミュレートし、TaxAgent(政府)はLLMを使って税率を反復的に最適化し、株式と生産性のバランスをとる。 Saez Optimal Taxation、合衆国の連邦所得税、自由市場を基準に、TaxAgentは優れた株式・効率のトレードオフを達成している。
論文参考訳（メタデータ） (2025-06-03T13:06:19Z)
Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。学習シナリオにおける同値性に基づく単一のフレームワークを提案する。我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文参考訳（メタデータ） (2024-05-09T12:52:22Z)
A Taxation Perspective for Fair Re-ranking [61.946428892727795]
本稿では,2項目間の実用性の違いに基づいて税率を上昇させる,税率という新たな公正な再格付け手法を提案する。我々のモデルである税ランクは、公正な優遇措置として優れた税率政策を提供し、理論的には、精度損失よりも連続性と制御性の両方を実証している。
論文参考訳（メタデータ） (2024-04-27T08:21:29Z)
Fairness Incentives in Response to Unfair Dynamic Pricing [7.991187769447732]
我々は基本的な模擬経済を設計し、公正な価格設定の行動を採用するよう企業にインセンティブを与えるために法人税のスケジュールを作成する。可能な政策シナリオを網羅するため、我々は、ソーシャルプランナーの学習問題を、マルチアームバンディット、コンテキストバンディット、およびフル強化学習(RL)問題として定式化する。社会的福祉はフェアネス非依存ベースラインのそれよりも改善し,マルチアームおよびコンテキストバンディット設定のための分析学的に最適なフェアネス対応ベースラインにアプローチすることを発見した。
論文参考訳（メタデータ） (2024-04-22T23:12:58Z)
Learning Optimal Tax Design in Nonatomic Congestion Games [56.85292809260111]
マルチプレイヤーゲームでは、プレイヤー間の利己的な行動が社会福祉を損なうことがある。我々は、渋滞ゲームにおいて、限られたフィードバックで社会福祉を誘導できる最適税を学習する最初のステップを採っている。
論文参考訳（メタデータ） (2024-02-12T06:32:53Z)
The Decisive Power of Indecision: Low-Variance Risk-Limiting Audits and Election Contestation via Marginal Mark Recording [51.82772358241505]
リスクリミット監査(リスクリミット監査、RLA)は、大規模な選挙の結果を検証する技術である。我々は、効率を改善し、統計力の進歩を提供する監査の新たなファミリーを定めている。新しい監査は、複数の可能なマーク解釈を宣言できるように、キャストボイトレコードの標準概念を再考することで実現される。
論文参考訳（メタデータ） (2024-02-09T16:23:54Z)
Entropy Regularization for Population Estimation [3.0175479520609887]
平均報酬推定タスクは、公共政策設定に不可欠であることが示されている。エントロピーとKLのばらつきを活用することで、既存のベースラインよりも報酬と推定値のばらつきが良くなることを示す。
論文参考訳（メタデータ） (2022-08-24T19:17:39Z)
Algorithmic Fairness and Vertical Equity: Income Fairness with IRS Tax Audit Models [73.24381010980606]
本研究は、IRSによる税務監査選択を通知するシステムの文脈におけるアルゴリズムフェアネスの問題について検討する。監査を選択するための柔軟な機械学習手法が、垂直エクイティにどのように影響するかを示す。この結果は,公共セクター全体でのアルゴリズムツールの設計に影響を及ぼす。
論文参考訳（メタデータ） (2022-06-20T16:27:06Z)
Confidence-Budget Matching for Sequential Budgeted Learning [69.77435313099366]
問合せ予算で意思決定問題を定式化する。我々は,多腕バンディット,線形バンディット,強化学習問題を考察する。我々は,CBMに基づくアルゴリズムが逆性の存在下で良好に動作することを示す。
論文参考訳（メタデータ） (2021-02-05T19:56:31Z)
An Evolutionary Game Model for Understanding Fraud in Consumption Taxes [0.0]
本稿では,消費税制における不正ダイナミクスを研究・理解するための計算進化ゲームモデルを提案する。プレイヤーは、付加価値税(VAT)を正しく申告し、それ以外の場合は、協力者です。企業間の取引は買い手と売り手の両方が宣言しなければならないため、一方が採用する戦略は他方の支払いに影響を与える。
論文参考訳（メタデータ） (2021-01-12T11:53:31Z)
CRACT: Cascaded Regression-Align-Classification for Robust Visual Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。 CRACは多くのベンチマークで最先端のパフォーマンスを得る。 OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文参考訳（メタデータ） (2020-11-25T02:18:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。