論文の概要: Robust Allocations with Diversity Constraints
- arxiv url: http://arxiv.org/abs/2109.15015v1
- Date: Thu, 30 Sep 2021 11:09:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:33:26.324379
- Title: Robust Allocations with Diversity Constraints
- Title(参考訳): 多様性制約を伴うロバストな配置
- Authors: Zeyu Shen and Lodewijk Gelauff and Ashish Goel and Aleksandra Korolova
and Kamesh Munagala
- Abstract要約: エージェント値の積を最大化するナッシュ福祉規則は,多様性の制約が導入されたとき,一意にロバストな位置にあることを示す。
また, ナッシュ・ウェルズによる保証は, 広く研究されているアロケーション・ルールのクラスにおいて, ほぼ最適であることを示す。
- 参考スコア(独自算出の注目度): 65.3799850959513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of allocating divisible items among multiple agents,
and consider the setting where any agent is allowed to introduce diversity
constraints on the items they are allocated. We motivate this via settings
where the items themselves correspond to user ad slots or task workers with
attributes such as race and gender on which the principal seeks to achieve
demographic parity. We consider the following question: When an agent expresses
diversity constraints into an allocation rule, is the allocation of other
agents hurt significantly? If this happens, the cost of introducing such
constraints is disproportionately borne by agents who do not benefit from
diversity. We codify this via two desiderata capturing robustness. These are no
negative externality -- other agents are not hurt -- and monotonicity -- the
agent enforcing the constraint does not see a large increase in value. We show
in a formal sense that the Nash Welfare rule that maximizes product of agent
values is uniquely positioned to be robust when diversity constraints are
introduced, while almost all other natural allocation rules fail this
criterion. We also show that the guarantees achieved by Nash Welfare are nearly
optimal within a widely studied class of allocation rules. We finally perform
an empirical simulation on real-world data that models ad allocations to show
that this gap between Nash Welfare and other rules persists in the wild.
- Abstract(参考訳): 我々は,複数のエージェント間で分割可能なアイテムを割り当てる問題を考えるとともに,エージェントが割り当てられたアイテムに多様性の制約を導入することを許容する設定を検討する。
我々は、アイテム自体がユーザー広告スロットやタスクワーカーと競合やジェンダーなどの属性で対応し、プリンシパルが人口比率を達成しようとする設定を通じてこれを動機付けている。
エージェントがアロケーションルールに多様性の制約を表現した場合、他のエージェントのアロケーションは著しく痛むか?
このような制約を導入するコストは、多様性の恩恵を受けないエージェントによって不当に負担される。
強靭性を捉えた2つのデシラタを用いてこれを符号化する。
これらは負の外部性ではなく、他のエージェントが傷つかない -- モノトニック性 -- 制約を強制するエージェントは、値が大きく増加することはない。
エージェント価値の積を最大化するnashの福祉規則は、多様性の制約が導入されると一意に強固に位置づけられるが、他のほぼ全ての自然割当規則はこの基準を満たさない。
また,ナッシュウェルズによる保証は,広く研究されているアロケーションルールのクラスにおいてほぼ最適であることを示す。
最後に,実世界のデータに対する経験的シミュレーションを行い,広告アロケーションをモデル化することで,ナッシュ福祉と他のルールとのギャップが野放しのままであることを示す。
関連論文リスト
- Partial Identifiability in Inverse Reinforcement Learning For Agents With Non-Exponential Discounting [64.13583792391783]
逆強化学習は、エージェントの振る舞いを観察することから、エージェントの好みを推測することを目的としている。
IRLの主な課題の1つは、複数の選好が同じ観察行動を引き起こす可能性があることである。
一般にIRLは、正しい最適ポリシーを特定するのに、$R$に関する十分な情報を推測できないことを示す。
論文 参考訳(メタデータ) (2024-12-15T11:08:58Z) - Using Protected Attributes to Consider Fairness in Multi-Agent Systems [7.061167083587786]
マルチエージェントシステム(MAS)の公正性は、システムのルール、エージェントの振る舞い、それらの特性など、さまざまな要因に依存する。
機械学習に基づく意思決定におけるバイアスに対処するアルゴリズムフェアネスの研究から着想を得た。
我々は、アルゴリズムの公正度文献から、自己関心のあるエージェントが環境内で相互作用するマルチエージェント設定まで、公平度メトリクスを適応させる。
論文 参考訳(メタデータ) (2024-10-16T08:12:01Z) - Stochastic Bandits for Egalitarian Assignment [58.33714486693828]
我々は,多武装盗賊の文脈における平等的課題であるEgalMABについて検討する。
UCBベースのポリシーEgalUCBを設計・分析し、累積的後悔の上限を確立する。
論文 参考訳(メタデータ) (2024-10-08T09:49:47Z) - Tackling Ambiguity from Perspective of Uncertainty Inference and Affinity Diversification for Weakly Supervised Semantic Segmentation [12.308473939796945]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセグメンテーション(WSSS)は、退屈なアノテーションを使わずに高密度なタスクを実現することを目的としている。
WSSSの性能、特にクラス活性化マップ(CAM)の生成と擬似マスクの精製の段階では、あいまいさに悩まされている。
統一された単一ステージWSSSフレームワークであるUniAを提案し、不確実性推論と親和性多様化の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2024-04-12T01:54:59Z) - Byzantine-Resilient Decentralized Multi-Armed Bandits [25.499420566469098]
エージェント間の情報混合ステップを不整合および極端な値の切り離しで融合するアルゴリズムを開発する。
このフレームワークは、コンピュータネットワークの攻撃者をモデル化したり、攻撃的なコンテンツをレコメンデーターシステムに攻撃したり、金融市場のマニピュレータとして利用することができる。
論文 参考訳(メタデータ) (2023-10-11T09:09:50Z) - Hierarchical Imitation Learning for Stochastic Environments [31.64016324441371]
分布的リアリズムを改善する既存の方法は通常階層的なポリシーに依存している。
環境条件下での対人訓練に伴う変化を解消するロバスト型条件付け(RTC)を提案する。
大規模なOpen Motionデータセットを含む2つの領域の実験では、最先端のベースラインと比較して、タスクパフォーマンスを維持したり改善したりしながら、分散リアリズムが改善された。
論文 参考訳(メタデータ) (2023-09-25T10:10:34Z) - Counterfactual Conservative Q Learning for Offline Multi-agent
Reinforcement Learning [54.788422270960496]
我々はCounterFactual conservative Q-Learning (CFCQL) という新しいマルチエージェントオフラインRLアルゴリズムを提案する。
CFCQLは、各エージェントの保守的正規化を非現実的に別々に計算し、それらを線形に組み合わせて全体的な保守的価値推定を実現する。
単一エージェントの保守的手法のように, まだ過小評価特性と性能保証を享受していることが証明されているが, 誘導正規化と安全な政策改善境界はエージェント番号とは無関係である。
論文 参考訳(メタデータ) (2023-09-22T08:10:25Z) - Diverse Rule Sets [20.170305081348328]
ルールベースのシステムは、直感的なif-then表現のためにルネッサンスを経験しています。
本稿では,ルール間の重なり合いを最適化することで,多様なルールセットを推定する新しい手法を提案する。
次に、高い差別性を持ち、重複が少ない規則をサンプリングする効率的なランダム化アルゴリズムを考案する。
論文 参考訳(メタデータ) (2020-06-17T14:15:25Z) - Randomized Entity-wise Factorization for Multi-Agent Reinforcement
Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。
我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文 参考訳(メタデータ) (2020-06-07T18:28:41Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。