Fugu-MT 論文翻訳(概要): Government Intervention in Catastrophe Insurance Markets: A Reinforcement Learning Approach

論文の概要: Government Intervention in Catastrophe Insurance Markets: A Reinforcement Learning Approach

arxiv url: http://arxiv.org/abs/2207.01010v1
Date: Sun, 3 Jul 2022 11:06:44 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-05 16:46:02.636797
Title: Government Intervention in Catastrophe Insurance Markets: A Reinforcement Learning Approach
Title（参考訳）: 災害保険市場における政府介入--強化学習アプローチ
Authors: Menna Hassan, Nourhan Sakr and Arthur Charpentier
Abstract要約: 本論文は,ケース・バイ・ケース・バイ・ケースで相互に比較することで,提案する介入の望ましさを厳格に論じる。本論文は, 実現可能性研究を支援するキャリブレーション理論モデルを用いて, アルゴリズムによる政策評価を行うための枠組みを提供する。
参考スコア（独自算出の注目度）: 0.04297070083645048
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper designs a sequential repeated game of a micro-founded society with three types of agents: individuals, insurers, and a government. Nascent to economics literature, we use Reinforcement Learning (RL), closely related to multi-armed bandit problems, to learn the welfare impact of a set of proposed policy interventions per $1 spent on them. The paper rigorously discusses the desirability of the proposed interventions by comparing them against each other on a case-by-case basis. The paper provides a framework for algorithmic policy evaluation using calibrated theoretical models which can assist in feasibility studies.
Abstract（参考訳）: 本稿では, 個人, 保険会社, 政府という3種類のエージェントによる, マイクロファウンデーション社会の連続的なゲームを設計する。経済文献のほかに、多武装の盗賊問題と密接に関連する強化学習(Reinforcement Learning, RL)を用いて、1ドルあたりの政策介入の提案による福祉効果を学習する。本論文は,提案手法をケースバイケースで比較することにより,提案手法の有効性を厳密に議論する。本論文は,実現可能性研究を支援する校正理論モデルを用いたアルゴリズム政策評価の枠組みを提供する。

関連論文リスト

A Theoretical Model for Grit in Pursuing Ambitious Ends [48.43624563381919]
我々は、多武装バンディットフレームワークの改善において、安定した選択とリスクのある選択の意思決定のモデルを提供する。我々は、グリットの増加や金融安全ネットの提供など、様々な介入の影響について検討する。
論文参考訳（メタデータ） (2025-03-04T19:17:42Z)
Classification problem in liability insurance using machine learning models: a comparative study [0.0]
我々は、負債保険政策を2つのグループに分類するために、いくつかの機械学習モデルを適用している。本研究では,クアズビニが使用したActuarial Challengeデータセットに対して,近接近傍やロジスティック回帰などの機械学習モデルを適用した。
論文参考訳（メタデータ） (2024-11-01T04:35:39Z)
Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.57122943187086]
脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文参考訳（メタデータ） (2024-07-02T03:31:21Z)
Structural Interventions and the Dynamics of Inequality [0.0]
技術的ソリューションは、社会的変化を起こすために、外部のコンテキスト対応の介入と組み合わせなければならないことを示す。この研究は、構造的不等式が、一見バイアスのない決定機構によって永続することができる方法を強調している。
論文参考訳（メタデータ） (2024-06-03T13:44:38Z)
Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文参考訳（メタデータ） (2024-04-29T08:16:30Z)
Fairness Incentives in Response to Unfair Dynamic Pricing [7.991187769447732]
我々は基本的な模擬経済を設計し、公正な価格設定の行動を採用するよう企業にインセンティブを与えるために法人税のスケジュールを作成する。可能な政策シナリオを網羅するため、我々は、ソーシャルプランナーの学習問題を、マルチアームバンディット、コンテキストバンディット、およびフル強化学習(RL)問題として定式化する。社会的福祉はフェアネス非依存ベースラインのそれよりも改善し,マルチアームおよびコンテキストバンディット設定のための分析学的に最適なフェアネス対応ベースラインにアプローチすることを発見した。
論文参考訳（メタデータ） (2024-04-22T23:12:58Z)
Networked Communication for Decentralised Agents in Mean-Field Games [59.01527054553122]
平均フィールドゲームフレームワークにネットワーク通信を導入する。当社のアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを証明しています。ネットワーク化されたアプローチは、障害の更新や人口規模の変化に対する堅牢性という点において、両方の選択肢に対して大きなメリットがあることが示されています。
論文参考訳（メタデータ） (2023-06-05T10:45:39Z)
Measuring Equality in Machine Learning Security Defenses: A Case Study in Speech Recognition [56.69875958980474]
この研究は、学習したシステムを守るためのアプローチと、異なるサブ人口間でのセキュリティ防衛がパフォーマンス上の不平等をもたらす方法を検討する。提案された多くの手法は、虚偽の拒絶やロバストネストレーニングの不平等といった直接的な害を引き起こす可能性がある。本稿では, ランダム化スムースメントとニューラルリジェクションの2つの防御法の比較を行い, マイノリティ集団のサンプリング機構により, ランダム化スムースメントがより公平であることを見出した。
論文参考訳（メタデータ） (2023-02-17T16:19:26Z)
Online Learning with Off-Policy Feedback [18.861989132159945]
本研究では,オフポリシーフィードバックと呼ばれる部分的可観測性モデルの下で,対向的帯域幅問題におけるオンライン学習の問題点について検討する。我々は,任意のコンパレータポリシーと行動ポリシーのミスマッチという自然な概念でスケールする後悔境界を保証するアルゴリズムのセットを提案する。
論文参考訳（メタデータ） (2022-07-18T21:57:16Z)
(Machine) Learning What Policies Value [2.0267847227859144]
本稿では,観測された割当決定と一致した値を明らかにする手法を開発した。機械学習の手法を使って、各個人が介入によってどれだけの恩恵を受けるかを推定します。メキシコのPROGRESAアンチ・ポルノ・プログラムを分析して、このアプローチを実証する。
論文参考訳（メタデータ） (2022-06-01T19:33:09Z)
Off-policy Reinforcement Learning with Optimistic Exploration and Distribution Correction [73.77593805292194]
我々は、政治以外のアクター批判的枠組みにおいて、批評家のほぼ上位信頼度を最大化するために、別の調査政策を訓練する。最近導入されたDICEフレームワークを応用して、非政治アクター犯罪訓練のための分布補正比を学習する。
論文参考訳（メタデータ） (2021-10-22T22:07:51Z)
Advocating for Multiple Defense Strategies against Adversarial Examples [66.90877224665168]
ニューラルネットワークを$ell_infty$敵の例から保護するために設計された防御機構が、性能の低下を実証的に観察されている。本稿では,この観測を検証した幾何学的解析を行う。そこで本研究では,この現象の実際的影響を説明するための実証的な知見を多数提示する。
論文参考訳（メタデータ） (2020-12-04T14:42:46Z)
A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。観測データに対する様々な因果効果推定法が誕生した。
論文参考訳（メタデータ） (2020-02-05T21:35:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。