論文の概要: Reinforcement Learning and Consumption-Savings Behavior
- arxiv url: http://arxiv.org/abs/2510.20748v1
- Date: Thu, 23 Oct 2025 17:14:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:18.434778
- Title: Reinforcement Learning and Consumption-Savings Behavior
- Title(参考訳): 強化学習と消費削減行動
- Authors: Brandon Kaplowitz,
- Abstract要約: 本稿では, 経済不況における家庭の消費行動に関する2つの実証的パターンを, 強化学習によって説明できることを示す。
エージェントがニューラルネットワーク近似を用いてQラーニングを使用して、所得不確実性の下で消費削減決定を行うモデルを開発した。
- 参考スコア(独自算出の注目度): 0.8594140167290097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper demonstrates how reinforcement learning can explain two puzzling empirical patterns in household consumption behavior during economic downturns. I develop a model where agents use Q-learning with neural network approximation to make consumption-savings decisions under income uncertainty, departing from standard rational expectations assumptions. The model replicates two key findings from recent literature: (1) unemployed households with previously low liquid assets exhibit substantially higher marginal propensities to consume (MPCs) out of stimulus transfers compared to high-asset households (0.50 vs 0.34), even when neither group faces borrowing constraints, consistent with Ganong et al. (2024); and (2) households with more past unemployment experiences maintain persistently lower consumption levels after controlling for current economic conditions, a "scarring" effect documented by Malmendier and Shen (2024). Unlike existing explanations based on belief updating about income risk or ex-ante heterogeneity, the reinforcement learning mechanism generates both higher MPCs and lower consumption levels simultaneously through value function approximation errors that evolve with experience. Simulation results closely match the empirical estimates, suggesting that adaptive learning through reinforcement learning provides a unifying framework for understanding how past experiences shape current consumption behavior beyond what current economic conditions would predict.
- Abstract(参考訳): 本稿では, 経済不況における家庭の消費行動における2つのパズルな経験的パターンを, 強化学習がいかに説明できるかを示す。
本稿では,ニューラルネットワークを用いたQラーニングを用いて,所得不確実性の下での消費削減決定を,標準的な合理的な期待前提から逸脱させるモデルを開発する。
本モデルでは, 従来低い流動資産を有する失業世帯は, 高評価世帯(0.50対0.34)と比較して, 高評価世帯(0.50対0.34)に比べて, 刺激伝達の余剰率(MPC)が著しく高く, いずれもGanong et al(2024)と整合性があり, 過去の失業経験を有する世帯は, マルメンディエとシェン(2024)によって記録された「スカーリング」効果が持続的に低下している。
所得リスクや不均一性に関する信念の更新に基づく既存の説明とは異なり、強化学習機構は、経験とともに進化する値関数近似誤差を通じて、より高いMPCと低い消費レベルの両方を同時に生成する。
シミュレーション結果は経験的推定と密接に一致し、強化学習による適応学習は、過去の経験が現在の経済状況が予測する以上の現在の消費行動をどのように形成するかを理解するための統一的な枠組みを提供することを示唆している。
関連論文リスト
- Methodological Insights into Structural Causal Modelling and Uncertainty-Aware Forecasting for Economic Indicators [4.9930207509018425]
我々は、GDP、経済成長、インフレ、失業の4つの主要なマクロ経済指標に焦点を当てている。
以上の結果から、経済成長とGDPとの強い一方向因果関係が明らかとなった。
我々は、失業に関するゼロショット予測を行うために、時系列のために訓練された大きな言語モデルを使用する。
論文 参考訳(メタデータ) (2025-09-08T04:52:12Z) - The Impact of Pseudo-Science in Financial Loans Risk Prediction [5.764237203972864]
金融融資におけるリスク予測への機械学習の直接適用による人々の行動予測における疑似科学的仮定の社会的影響について検討する。
本研究は,社会的に最適なモデルが,この下流作業において有意な精度の損失を生じさせないことを示すものである。
論文 参考訳(メタデータ) (2025-07-22T02:53:13Z) - Mitigating Spurious Correlations in LLMs via Causality-Aware Post-Training [57.03005244917803]
大規模言語モデル (LLMs) は、事前学習中に得られた素早い相関関係により、アウト・オブ・ディストリビューション (OOD) のサンプルで失敗することが多い。
ここでは、因果認識後学習(CAPT)を通して、このような素因的相関を緩和することを目的とする。
公式因果推論ベンチマークCLadderと論理推論データセットPrOntoQAの実験により、CAPTで微調整された3Bスケールの言語モデルでは、従来のSFTおよびより大きなLLMを分散処理(ID)およびOODタスクで上回る結果が得られた。
論文 参考訳(メタデータ) (2025-06-11T06:30:28Z) - Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
予測型因果推論(PPCI)に焦点をあてる
PPCIは、未ラベルの事実結果を用いた対象実験における治療効果を推定し、事前訓練されたモデルからゼロショットを取得する。
バニラ実験的リスク最小化によって解決不可能なインスタンスに対するソリューションを提供するため,本手法を合成および実世界の科学的データに対して検証する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Investigating Tax Evasion Emergence Using Dual Large Language Model and Deep Reinforcement Learning Powered Agent-based Simulation [5.414308305392762]
本研究では,脱税のダイナミクスと非公式経済活動の出現を明らかにするための新しい計算枠組みを提案する。
このフレームワークには,大規模言語モデルと深層強化学習が使用されている。
調査の結果,個人の性格特性,外的物語,施行可能性,公共財提供の効率性は,非公式な経済活動のタイミングと範囲に大きな影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2025-01-30T07:14:50Z) - Investigating the Robustness of Counterfactual Learning to Rank Models: A Reproducibility Study [71.04084063541777]
ランク付けのためのカウンターファクトラーニングはIRコミュニティで広く注目を集めている。
モデルは、ユーザの振る舞いの仮定が正しく、確率推定が正確であるときに理論的に非バイアス化される。
それらの有効性は通常シミュレーションベースの実験を通じて実証的に評価されるが、これは広く利用可能な大規模で実際のクリックログが不足しているためである。
論文 参考訳(メタデータ) (2024-04-04T10:54:38Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Stateful Offline Contextual Policy Evaluation and Learning [88.9134799076718]
我々は、シーケンシャルデータから、政治以外の評価と学習について研究する。
動的パーソナライズされた価格設定などの問題の因果構造を形式化する。
本報告では,本クラスにおけるアウト・オブ・サンプル・ポリシーの性能改善について述べる。
論文 参考訳(メタデータ) (2021-10-19T16:15:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。