論文の概要: TaxCalcBench: Evaluating Frontier Models on the Tax Calculation Task
- arxiv url: http://arxiv.org/abs/2507.16126v1
- Date: Tue, 22 Jul 2025 00:37:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:13.917454
- Title: TaxCalcBench: Evaluating Frontier Models on the Tax Calculation Task
- Title(参考訳): TaxCalcBench:課税計算タスクにおけるフロンティアモデルの評価
- Authors: Michael R. Bock, Kara Molisee, Zachary Ozer, Sumit Shah,
- Abstract要約: 米国の個人所得税の計算は、膨大な量の英文を理解することを必要とするタスクである。
我々は、個人所得税率を計算できるモデルの能力を決定するためのベンチマークであるTaxCalcBenchを提案する。
- 参考スコア(独自算出の注目度): 0.11999555634662631
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Can AI file your taxes? Not yet. Calculating US personal income taxes is a task that requires building an understanding of vast amounts of English text and using that knowledge to carefully compute results. We propose TaxCalcBench, a benchmark for determining models' abilities to calculate personal income tax returns given all of the necessary information. Our experiment shows that state-of-the-art models succeed in calculating less than a third of federal income tax returns even on this simplified sample set. Our analysis concludes that models consistently misuse tax tables, make errors in tax calculation, and incorrectly determine eligibility. Our findings point to the need for additional infrastructure to apply LLMs to the personal income tax calculation task.
- Abstract(参考訳): AIはあなたの税金を申告できますか?
まだだ。
米国の個人所得税の計算は、膨大な量の英文の理解を築き、その知識を使って結果を注意深く計算する必要があるタスクである。
必要な情報をすべて考慮し、個人所得税率を計算できるモデル能力を決定するためのベンチマークであるTaxCalcBenchを提案する。
この単純化されたサンプルセットであっても、最先端のモデルでは連邦所得税率の3分の1以下を計算できることを示す。
我々の分析では、モデルは常に税表を誤用し、納税計算の誤りを犯し、不正に適当性を判断していると結論付けている。
この結果から、個人所得税算定業務にLLMを適用するための追加インフラの必要性が指摘された。
関連論文リスト
- TaxAgent: How Large Language Model Designs Fiscal Policy [22.859190941594296]
本研究では,大規模言語モデル(LLM)とエージェントベースモデリング(ABM)を統合し,適応型税制を設計するTaxAgentを紹介する。
我々のマクロ経済シミュレーションでは、ヘテロジニアスなH-Agents(ハウスホールディングス)が現実の納税者の振る舞いをシミュレートし、TaxAgent(政府)はLLMを使って税率を反復的に最適化し、株式と生産性のバランスをとる。
Saez Optimal Taxation、合衆国の連邦所得税、自由市場を基準に、TaxAgentは優れた株式・効率のトレードオフを達成している。
論文 参考訳(メタデータ) (2025-06-03T13:06:19Z) - A Taxation Perspective for Fair Re-ranking [61.946428892727795]
本稿では,2項目間の実用性の違いに基づいて税率を上昇させる,税率という新たな公正な再格付け手法を提案する。
我々のモデルである税ランクは、公正な優遇措置として優れた税率政策を提供し、理論的には、精度損失よりも連続性と制御性の両方を実証している。
論文 参考訳(メタデータ) (2024-04-27T08:21:29Z) - Learning Optimal Tax Design in Nonatomic Congestion Games [56.85292809260111]
マルチプレイヤーゲームでは、プレイヤー間の利己的な行動が社会福祉を損なうことがある。
我々は、渋滞ゲームにおいて、限られたフィードバックで社会福祉を誘導できる最適税を学習する最初のステップを採っている。
論文 参考訳(メタデータ) (2024-02-12T06:32:53Z) - On the Potential and Limitations of Few-Shot In-Context Learning to
Generate Metamorphic Specifications for Tax Preparation Software [12.071874385139395]
納税者の50%近くが、FY22にアメリカで税ソフトウェアを使って個人所得税を申告した。
本稿では,税制文書から抽出した属性間の翻訳タスクとして,変成仕様を作成するタスクを定式化する。
論文 参考訳(メタデータ) (2023-11-20T18:12:28Z) - OpenAI Cribbed Our Tax Example, But Can GPT-4 Really Do Tax? [50.46167465931653]
筆者らは,GPT-4のライブストリームデモにおいて,OpenAIが税法の実例を得た理由を説明している。
彼らはまた、なぜGPT-4が間違った答えを得たのか、どうやって確実に税を計算できないのかを説明した。
論文 参考訳(メタデータ) (2023-09-15T20:00:27Z) - Algorithmic Fairness and Vertical Equity: Income Fairness with IRS Tax
Audit Models [73.24381010980606]
本研究は、IRSによる税務監査選択を通知するシステムの文脈におけるアルゴリズムフェアネスの問題について検討する。
監査を選択するための柔軟な機械学習手法が、垂直エクイティにどのように影響するかを示す。
この結果は,公共セクター全体でのアルゴリズムツールの設計に影響を及ぼす。
論文 参考訳(メタデータ) (2022-06-20T16:27:06Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - Tax Knowledge Graph for a Smarter and More Personalized TurboTax [0.0]
我々は、大規模なナレッジグラフを通じて、米国とカナダの複雑な所得税コンプライアンスロジックを表現するための革新的で実践的なアプローチを共有します。
納税知識グラフの構築と自動化、納税額の計算、情報不足の理由付け、計算結果の説明などについて紹介する。
論文 参考訳(メタデータ) (2020-09-13T22:41:01Z) - The AI Economist: Improving Equality and Productivity with AI-Driven Tax
Policies [119.07163415116686]
我々は、経済的平等と生産性を効果的にトレードオフできる税制政策を発見する社会プランナーを訓練する。
競争圧力と市場ダイナミクスを特徴とする経済シミュレーション環境を提案する。
AI主導の税政策は、基本方針よりも平等と生産性のトレードオフを16%改善することを示します。
論文 参考訳(メタデータ) (2020-04-28T06:57:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。