論文の概要: Improving Welfare in One-sided Matching using Simple Threshold Queries
- arxiv url: http://arxiv.org/abs/2011.13977v2
- Date: Mon, 12 Jul 2021 14:36:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 02:40:09.291232
- Title: Improving Welfare in One-sided Matching using Simple Threshold Queries
- Title(参考訳): 簡易しきい値クエリを用いた片面マッチングの福祉改善
- Authors: Thomas Ma, Vijay Menon, Kate Larson
- Abstract要約: 我々は、$n$エージェントが$m$オブジェクトよりも好みを持つ一方的なマッチング問題を研究する。
簡単なしきい値クエリを使って、彼らの基準的嗜好についてもっと学ぶことに集中する。
- 参考スコア(独自算出の注目度): 9.270928705464193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study one-sided matching problems where $n$ agents have preferences over
$m$ objects and each of them need to be assigned to at most one object. Most
work on such problems assume that the agents only have ordinal preferences and
usually the goal in them is to compute a matching that satisfies some notion of
economic efficiency. However, in reality, agents may have some preference
intensities or cardinal utilities that, e.g., indicate that they like an object
much more than another object, and not taking these into account can result in
a loss in welfare. While one way to potentially account for these is to
directly ask the agents for this information, such an elicitation process is
cognitively demanding. Therefore, we focus on learning more about their
cardinal preferences using simple threshold queries which ask an agent if they
value an object greater than a certain value, and use this in turn to come up
with algorithms that produce a matching that, for a particular economic notion
$X$, satisfies $X$ and also achieves a good approximation to the optimal
welfare among all matchings that satisfy $X$. We focus on several notions of
economic efficiency, and look at both adaptive and non-adaptive algorithms.
Overall, our results show how one can improve welfare by even non-adaptively
asking the agents for just one bit of extra information per object.
- Abstract(参考訳): 我々は、$n$エージェントが$m$オブジェクトよりも好みを持つ一方的なマッチング問題について検討し、そのそれぞれを1つのオブジェクトに割り当てる必要がある。
このような問題に関するほとんどの研究は、エージェントが順序的な選好しか持たず、その目標が経済効率の概念を満たすマッチングを計算することであると仮定している。
しかし、実際には、エージェントは、例えば、他のオブジェクトよりもずっと対象を好んでいて、それらを考慮しないような、いくつかの好みの強度や基本的なユーティリティを持っているかもしれない。
それらを説明する一つの方法は、エージェントにこの情報を直接尋ねることであるが、そのような誘発過程は認知的に要求される。
したがって、特定の経済概念である$x$ に対して$x$ を満たし、$x$ を満たすすべてのマッチングを満足させるマッチングアルゴリズムを生成するために、エージェントに特定の値以上のオブジェクトを評価させるかどうかを問う単純なしきい値クエリを用いて、基数選好についてより多くを学ぶことに焦点をあてる。
我々は、経済効率のいくつかの概念に注目し、適応型アルゴリズムと非適応型アルゴリズムの両方を考察する。
以上の結果から,対象物ごとの余分な情報のみをエージェントに問い合わせることによって,福祉を改善する方法が示唆された。
関連論文リスト
- Satisficing Exploration for Deep Reinforcement Learning [26.73584163318647]
現実世界の広大さと規模にアプローチする複雑な環境では、最適な性能を達成することは、実際には完全に難易度の高い試みであるかもしれない。
最近の研究は、情報理論から設計エージェントへのツールを活用し、十分な満足や満足のいくソリューションを優先して最適なソリューションを意図的に実現している。
モデルベース計画の必要性を回避し、満足度の高いポリシーを学習できるように、最適な値関数に対する不確実性を直接表現するエージェントを拡張します。
論文 参考訳(メタデータ) (2024-07-16T21:28:03Z) - Optimal Multi-Fidelity Best-Arm Identification [65.23078799972188]
バンディットのベストアーム識別において、アルゴリズムは、できるだけ早く特定の精度で、最高平均報酬の腕を見つけることを任務とする。
マルチフィデリティのベストアーム識別について検討し、低コストで低いフィデリティ(正確な平均推定値を持たない)で腕をサンプリングすることを選択できる。
この問題に対処するためのいくつかの方法が提案されているが、その最適性は、特に最適な腕を特定するのに必要な総コストのゆるやかな下限のため、未解決のままである。
論文 参考訳(メタデータ) (2024-06-05T08:02:40Z) - Ranking a Set of Objects using Heterogeneous Workers: QUITE an Easy
Problem [54.90613714264689]
我々は、不平等労働者の群れによって提供されるノイズの多いペア比較の集合から始まる、$N$オブジェクトのランク付けの問題に焦点をあてる。
本研究では,作業者の信頼性とオブジェクトの品質を共同で推定する非適応的ランキングアルゴリズムQUITEを提案する。
論文 参考訳(メタデータ) (2023-10-03T12:42:13Z) - Experience in Engineering Complex Systems: Active Preference Learning
with Multiple Outcomes and Certainty Levels [1.5257326975704795]
ブラックボックス最適化とは、目的関数と/または制約集合が未知、到達不能、あるいは存在しない問題を指す。
この特定の情報を活用するために、いわゆるActive Preference Learningと呼ばれるアルゴリズムが開発された。
我々のアプローチは、さらなる情報を効果的に活用できるような方法でアルゴリズムを拡張することを目的としている。
論文 参考訳(メタデータ) (2023-02-27T15:55:37Z) - Should All Proposals be Treated Equally in Object Detection? [110.27485090952385]
オブジェクト検出器の複雑さと精度のトレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。
検出効率の改善には、提案の不平等な処理に向けて、パラダイムシフトが必要であると仮定されている。
これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
論文 参考訳(メタデータ) (2022-07-07T18:26:32Z) - A new perspective on classification: optimally allocating limited
resources to uncertain tasks [4.169130102668252]
例えば、クレジットカード詐欺検出では、銀行は詐欺捜査チームに少数の取引しか割り当てることができない。
我々は、タスクの不確実性に対処するために分類を使うことは、利用可能な能力を考慮していないため、本質的には最適ではないと論じる。
本稿では,限られた能力しか持たない課題の期待利益を直接最適化することで,ランク付けのための学習を用いた新しいソリューションを提案する。
論文 参考訳(メタデータ) (2022-02-09T10:14:45Z) - Consequences of Misaligned AI [12.879600368339393]
本稿では,報酬関数の設計をインタラクティブでダイナミックなプロセスとみなすべきである。
セットアップを変更して、完全な状態を参照したり、プリンシパルがプロキシの目的を時間とともに更新したりすることで、より高いユーティリティソリューションを実現する方法を示します。
論文 参考訳(メタデータ) (2021-02-07T19:34:04Z) - Necessarily Optimal One-Sided Matchings [49.0517583218216]
我々は、$n$エージェントと$n$オブジェクトとをマッチングする古典的な問題について研究する。
エージェントに完全な選好を報告させる代わりに、私たちのゴールは部分的な選好から望ましいマッチングを学ぶことです。
我々は,与えられたマッチングが NPO か NRM かを確認し,そのようなマッチングが与えられたトップ$k$ の部分的選好が存在するかどうかを確認するために,効率的なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-07-17T16:01:34Z) - Sequential Transfer in Reinforcement Learning with a Generative Model [48.40219742217783]
本稿では,従来の課題から知識を移譲することで,新たな課題を学習する際のサンプルの複雑さを軽減する方法について述べる。
この種の事前知識を使用することのメリットを明確に示すために,PAC境界のサンプル複雑性を導出する。
簡単なシミュレートされた領域における理論的な発見を実証的に検証する。
論文 参考訳(メタデータ) (2020-07-01T19:53:35Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。