論文の概要: Robust Allocations with Diversity Constraints
- arxiv url: http://arxiv.org/abs/2109.15015v1
- Date: Thu, 30 Sep 2021 11:09:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:33:26.324379
- Title: Robust Allocations with Diversity Constraints
- Title(参考訳): 多様性制約を伴うロバストな配置
- Authors: Zeyu Shen and Lodewijk Gelauff and Ashish Goel and Aleksandra Korolova
and Kamesh Munagala
- Abstract要約: エージェント値の積を最大化するナッシュ福祉規則は,多様性の制約が導入されたとき,一意にロバストな位置にあることを示す。
また, ナッシュ・ウェルズによる保証は, 広く研究されているアロケーション・ルールのクラスにおいて, ほぼ最適であることを示す。
- 参考スコア(独自算出の注目度): 65.3799850959513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of allocating divisible items among multiple agents,
and consider the setting where any agent is allowed to introduce diversity
constraints on the items they are allocated. We motivate this via settings
where the items themselves correspond to user ad slots or task workers with
attributes such as race and gender on which the principal seeks to achieve
demographic parity. We consider the following question: When an agent expresses
diversity constraints into an allocation rule, is the allocation of other
agents hurt significantly? If this happens, the cost of introducing such
constraints is disproportionately borne by agents who do not benefit from
diversity. We codify this via two desiderata capturing robustness. These are no
negative externality -- other agents are not hurt -- and monotonicity -- the
agent enforcing the constraint does not see a large increase in value. We show
in a formal sense that the Nash Welfare rule that maximizes product of agent
values is uniquely positioned to be robust when diversity constraints are
introduced, while almost all other natural allocation rules fail this
criterion. We also show that the guarantees achieved by Nash Welfare are nearly
optimal within a widely studied class of allocation rules. We finally perform
an empirical simulation on real-world data that models ad allocations to show
that this gap between Nash Welfare and other rules persists in the wild.
- Abstract(参考訳): 我々は,複数のエージェント間で分割可能なアイテムを割り当てる問題を考えるとともに,エージェントが割り当てられたアイテムに多様性の制約を導入することを許容する設定を検討する。
我々は、アイテム自体がユーザー広告スロットやタスクワーカーと競合やジェンダーなどの属性で対応し、プリンシパルが人口比率を達成しようとする設定を通じてこれを動機付けている。
エージェントがアロケーションルールに多様性の制約を表現した場合、他のエージェントのアロケーションは著しく痛むか?
このような制約を導入するコストは、多様性の恩恵を受けないエージェントによって不当に負担される。
強靭性を捉えた2つのデシラタを用いてこれを符号化する。
これらは負の外部性ではなく、他のエージェントが傷つかない -- モノトニック性 -- 制約を強制するエージェントは、値が大きく増加することはない。
エージェント価値の積を最大化するnashの福祉規則は、多様性の制約が導入されると一意に強固に位置づけられるが、他のほぼ全ての自然割当規則はこの基準を満たさない。
また,ナッシュウェルズによる保証は,広く研究されているアロケーションルールのクラスにおいてほぼ最適であることを示す。
最後に,実世界のデータに対する経験的シミュレーションを行い,広告アロケーションをモデル化することで,ナッシュ福祉と他のルールとのギャップが野放しのままであることを示す。
関連論文リスト
- Byzantine-Resilient Decentralized Multi-Armed Bandits [25.499420566469098]
エージェント間の情報混合ステップを不整合および極端な値の切り離しで融合するアルゴリズムを開発する。
このフレームワークは、コンピュータネットワークの攻撃者をモデル化したり、攻撃的なコンテンツをレコメンデーターシステムに攻撃したり、金融市場のマニピュレータとして利用することができる。
論文 参考訳(メタデータ) (2023-10-11T09:09:50Z) - Hierarchical Imitation Learning for Stochastic Environments [31.64016324441371]
分布的リアリズムを改善する既存の方法は通常階層的なポリシーに依存している。
環境条件下での対人訓練に伴う変化を解消するロバスト型条件付け(RTC)を提案する。
大規模なOpen Motionデータセットを含む2つの領域の実験では、最先端のベースラインと比較して、タスクパフォーマンスを維持したり改善したりしながら、分散リアリズムが改善された。
論文 参考訳(メタデータ) (2023-09-25T10:10:34Z) - Counterfactual Conservative Q Learning for Offline Multi-agent
Reinforcement Learning [54.788422270960496]
我々はCounterFactual conservative Q-Learning (CFCQL) という新しいマルチエージェントオフラインRLアルゴリズムを提案する。
CFCQLは、各エージェントの保守的正規化を非現実的に別々に計算し、それらを線形に組み合わせて全体的な保守的価値推定を実現する。
単一エージェントの保守的手法のように, まだ過小評価特性と性能保証を享受していることが証明されているが, 誘導正規化と安全な政策改善境界はエージェント番号とは無関係である。
論文 参考訳(メタデータ) (2023-09-22T08:10:25Z) - Source-free Domain Adaptation Requires Penalized Diversity [60.04618512479438]
ソースデータがない場合、異なるドメイン間の知識伝達に対処するために、ソースフリードメイン適応(SFDA)が導入された。
教師なしのFDAでは、多様性はソース上の1つの仮説を学習するか、共有された特徴抽出器で複数の仮説を学習することに限定される。
本稿では,異なる特徴抽出器を用いて表現多様性を促進する新しい無教師付きSFDAアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-06T00:20:19Z) - Resource Allocation to Agents with Restrictions: Maximizing Likelihood
with Minimum Compromise [28.2469613376685]
原理は、各エージェントが何らかの確率でリソースにマッチするように、ランダムに最大マッチングを選択することを示す。
エージェントは、制限を一定の範囲内で変更することで、マッチする可能性を改善したいと考えています。
本研究では,合成データセットと2つの新しい実世界のデータセットについて実験的に評価した。
論文 参考訳(メタデータ) (2022-09-12T11:58:19Z) - ERMAS: Becoming Robust to Reward Function Sim-to-Real Gaps in
Multi-Agent Simulations [110.72725220033983]
Epsilon-Robust Multi-Agent Simulation (ERMAS)は、このようなマルチエージェントのsim-to-realギャップに対して堅牢なAIポリシーを学ぶためのフレームワークである。
ERMASは、エージェントリスク回避の変化に対して堅牢な税政策を学び、複雑な時間シミュレーションで最大15%社会福祉を改善する。
特に、ERMASは、エージェントリスク回避の変化に対して堅牢な税制政策を学び、複雑な時間シミュレーションにおいて、社会福祉を最大15%改善する。
論文 参考訳(メタデータ) (2021-06-10T04:32:20Z) - Diverse Rule Sets [20.170305081348328]
ルールベースのシステムは、直感的なif-then表現のためにルネッサンスを経験しています。
本稿では,ルール間の重なり合いを最適化することで,多様なルールセットを推定する新しい手法を提案する。
次に、高い差別性を持ち、重複が少ない規則をサンプリングする効率的なランダム化アルゴリズムを考案する。
論文 参考訳(メタデータ) (2020-06-17T14:15:25Z) - Randomized Entity-wise Factorization for Multi-Agent Reinforcement
Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。
我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文 参考訳(メタデータ) (2020-06-07T18:28:41Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。