Fugu-MT 論文翻訳(概要): Mitigating Externalities while Learning: an Online Version of the Coase Theorem

論文の概要: Mitigating Externalities while Learning: an Online Version of the Coase Theorem

arxiv url: http://arxiv.org/abs/2406.19824v1
Date: Fri, 28 Jun 2024 11:00:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-01 17:00:05.743637
Title: Mitigating Externalities while Learning: an Online Version of the Coase Theorem
Title（参考訳）: 学習中の外部性を模倣する:Coase Theoremのオンライン版
Authors: Scheid Antoine, Capitaine Aymeric, Boursier Etienne, Moulines Eric, Jordan Michael, Durmus Alain,
Abstract要約: 経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。次に、プレイヤーが全福祉を最大化する交渉戦略を学習できるようにするための政策を設計する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In economic theory, the concept of externality refers to any indirect effect resulting from an interaction between players that affects the social welfare. Most of the models within which externality has been studied assume that agents have perfect knowledge of their environment and preferences. This is a major hindrance to the practical implementation of many proposed solutions. To address this issue, we consider a two-player bandit setting where the actions of one of the players affect the other player and we extend the Coase theorem [Coase, 1960]. This result shows that the optimal approach for maximizing the social welfare in the presence of externality is to establish property rights, i.e., enable transfers and bargaining between the players. Our work removes the classical assumption that bargainers possess perfect knowledge of the underlying game. We first demonstrate that in the absence of property rights, the social welfare breaks down. We then design a policy for the players which allows them to learn a bargaining strategy which maximizes the total welfare, recovering the Coase theorem under uncertainty.
Abstract（参考訳）: 経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。外部性を研究するモデルの多くは、エージェントが環境や嗜好について完全な知識を持っていると仮定している。これは、多くの提案されたソリューションの実践的な実装に対する大きな障害である。この問題に対処するため、一方のプレイヤーのアクションが他方のプレイヤーに影響を与えるような2人のプレイヤーのバンディット設定を検討し、コーズ定理を拡張した(Coase, 1960)。この結果は、外部性の存在下での社会的福祉を最大化するための最適なアプローチは、財産権を確立すること、すなわちプレイヤー間の移動と交渉を可能にすることである。我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。まず、財産権がなければ社会福祉は崩壊するということを実証する。次に、プレイヤーが全福祉を最大化する交渉戦略を学べるようにポリシーを設計し、不確実性の下でコーズ定理を回復する。

関連論文リスト

Decoding fairness: a reinforcement learning perspective [6.0413802011767705]
我々は,各プレイヤーに2つのQテーブルを割り当て,提案者と応答者の役割決定を導出する最後通しゲーム(UG)にQラーニングを適用する。 2人のプレイヤーのシナリオでは、経験と将来の報酬の両方が評価されるときに、公平さが顕著に現れる。我々のメカニズム分析により,システムは2段階の段階を経て,最終的に公正あるいは合理的な戦略へと安定化することが明らかとなった。
論文参考訳（メタデータ） (2024-12-20T01:29:49Z)
Subsidy design for better social outcomes [24.2043855572415]
セントラルプランナーはこれらの問題を大幅に軽減できる補助金を注入することでシステムに関連するコストを削減できる我々は、社会的利益を完璧に最適化する補助金の設計について、アナーキー価格の最小化や情報回避行動の防止の観点から、標準的な複雑性理論の仮定の下で計算的に困難であることを示す。
論文参考訳（メタデータ） (2024-09-04T23:38:30Z)
Advantage Alignment Algorithms [20.125992203908744]
本稿では,効率よく直感的に対戦型シェーピングを行うアルゴリズムであるAdvantage Alignmentを紹介する。我々は、相互作用エージェントの利点を整合させ、相互作用が正のときに相互に有益な作用の確率を増大させることにより、これを達成した。我々は,様々な社会的ジレンマにまたがるアルゴリズムの有効性を実証し,最先端の協力と搾取に対する堅牢性を実現した。
論文参考訳（メタデータ） (2024-06-20T18:30:09Z)
Causal Fairness for Outcome Control [68.12191782657437]
本稿では,自動システムにおいて,公平かつ公平な結果変数を最適化することを目的とした,結果制御と呼ばれる特定の意思決定タスクについて検討する。本稿では、まず因果レンズを通して利益の概念を分析し、特定の個人が肯定的な決定によってどれだけの利益を得られるかを明らかにする。次に、保護された属性の影響を受けている可能性があることに留意し、これを分析するために使用できる因果的ツールを提案する。
論文参考訳（メタデータ） (2023-06-08T09:31:18Z)
How Bad is Selfish Driving? Bounding the Inefficiency of Equilibria in Urban Driving Games [64.71476526716668]
我々は,任意の平衡選手がプレーに同意するであろう効率について検討する。我々は、アナーキーの価格に関する既存の境界を洗練させる保証を得る。提案手法はオープンループ軌道に対する懸念を保証しているが,エージェントがクローズドループポリシーを採用する場合においても,効率的な平衡を観測する。
論文参考訳（メタデータ） (2022-10-24T09:32:40Z)
Formal Contracts Mitigate Social Dilemmas in Multi-Agent RL [4.969697978555126]
マルチエージェント強化学習(MARL)は、共通の環境で独立して行動する自律エージェントを訓練するための強力なツールである。 MARLは、個人インセンティブとグループインセンティブが多様化する際の準最適行動を引き起こす。本稿では,事前に規定された条件下で,エージェントが自発的に報酬の束縛に同意するマルコフゲームの拡張を提案する。
論文参考訳（メタデータ） (2022-08-22T17:42:03Z)
Robust Allocations with Diversity Constraints [65.3799850959513]
エージェント値の積を最大化するナッシュ福祉規則は,多様性の制約が導入されたとき,一意にロバストな位置にあることを示す。また, ナッシュ・ウェルズによる保証は, 広く研究されているアロケーション・ルールのクラスにおいて, ほぼ最適であることを示す。
論文参考訳（メタデータ） (2021-09-30T11:09:31Z)
Bounded rationality for relaxing best response and mutual consistency: An information-theoretic model of partial self-reference [0.0]
この研究は、相互整合性やベストレスポンスなど、合理的性の前提となるいくつかの仮定に焦点を当てている。我々は、レベル-$k$推論と量子応答平衡(QRE)の概念を用いて、これらの仮定を緩和する方法を検討する。
論文参考訳（メタデータ） (2021-06-30T06:56:56Z)
Learning Strategies in Decentralized Matching Markets under Uncertain Preferences [91.3755431537592]
エージェントの選好が不明な場合,共有資源の不足の設定における意思決定の問題について検討する。我々のアプローチは、再生されたカーネルヒルベルト空間における好みの表現に基づいている。エージェントの期待した利益を最大化する最適な戦略を導出する。
論文参考訳（メタデータ） (2020-10-29T03:08:22Z)
End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。明示的および暗黙的な区別に基づく2つのアプローチを提案する。分析結果は、実世界のいくつかの問題を用いて検証される。
論文参考訳（メタデータ） (2020-10-26T18:39:32Z)
Fair Influence Maximization: A Welfare Optimization Approach [34.39574750992602]
我々は、公正な影響アルゴリズムが満たすべき特性を原則的に特徴づける。この枠組みの下では、公平性と効率性のトレードオフは単一の設計逆転パラメータによって制御できる。我々の枠組みは、特殊ケースのレキシミンと比例フェアネスを包含する。
論文参考訳（メタデータ） (2020-06-14T14:08:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。