Fugu-MT 論文翻訳(概要): New Perspectives in Online Contract Design: Heterogeneous, Homogeneous, Non-myopic Agents and Team Production

論文の概要: New Perspectives in Online Contract Design: Heterogeneous, Homogeneous, Non-myopic Agents and Team Production

arxiv url: http://arxiv.org/abs/2403.07143v1
Date: Mon, 11 Mar 2024 20:28:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-13 23:45:52.760586
Title: New Perspectives in Online Contract Design: Heterogeneous, Homogeneous, Non-myopic Agents and Team Production
Title（参考訳）: オンラインコントラクト設計の新しい視点:不均一、均一、非心筋エージェントとチーム生産
Authors: Shiliang Zuo
Abstract要約: オンライン学習の観点から,反復する主エージェント問題について検討する。各設定で学習アルゴリズムを設計するための様々なアプローチとテクニックを提示します。
参考スコア（独自算出の注目度）: 2.296475290901356
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This work studies the repeated principal-agent problem from an online learning perspective. The principal's goal is to learn the optimal contract that maximizes her utility through repeated interactions, without prior knowledge of the agent's type (i.e., the agent's cost and production functions). I study three different settings when the principal contracts with a $\textit{single}$ agent each round: 1. The agents are heterogeneous; 2. the agents are homogenous; 3. the principal interacts with the same agent and the agent is non-myopic. I present different approaches and techniques for designing learning algorithms in each setting. For heterogeneous agent types, I identify a condition that allows the problem to be reduced to Lipschitz bandits directly. For identical agents, I give a polynomial sample complexity scheme to learn the optimal contract based on inverse game theory. For strategic non-myopic agents, I design a low strategic-regret mechanism. Also, I identify a connection between linear contracts and posted-price auctions, showing the two can be reduced to one another, and give a regret lower bound on learning the optimal linear contract based on this observation. I also study a $\textit{team production}$ model. I identify a condition under which the principal's learning problem can be reformulated as solving a family of convex programs, thereby showing the optimal contract can be found efficiently.
Abstract（参考訳）: 本研究は, オンライン学習の観点から, 繰り返し主エージェント問題について考察する。プリンシパルのゴールは、エージェントのタイプ(すなわちエージェントのコストと生産機能)を事前に知ることなく、反復的な相互作用を通じて彼女の効用を最大化する最適な契約を学習することである。私は、$\textit{single}$エージェントとのプリンシパルコントラクトがラウンド毎に3つの異なる設定を研究する。 1.その剤は異質である。 2) 薬剤は均質である。 3. プリンシパルは同一のエージェントと相互作用し、そのエージェントは非ミオピックである。各設定で学習アルゴリズムを設計するための異なる手法と手法を提案する。不均一なエージェントタイプに対しては、問題を直接リプシッツ・バンディットに還元できる条件を特定します。同一エージェントに対して,逆ゲーム理論に基づく最適契約を学習するための多項式サンプル複雑性スキームを与える。戦略的非筋電的エージェントに対しては、低戦略的反応機構を設計する。また, 線形契約とポストプライスオークションの関連性を同定し, 両契約を互いに還元できることを示すとともに, この観測に基づいて最適線形契約を学習する上で, 後悔の少ない制約を与える。また、$\textit{team production}$ modelも研究しています。主旨の学習問題を凸プログラムのファミリーの解決として再構成できる条件を特定し、最適な契約を効果的に示すことができる。

関連論文リスト

The Pseudo-Dimension of Contracts [8.710927418537908]
アルゴリズム契約設計は、主任がエージェントに彼女の代理として努力するよう動機付けるシナリオを研究する。本研究では,エージェントの型が未知の分布から引き出される設定と,サンプルエージェントの型から最適に近いコントラクトを学習するためのオフライン学習フレームワークに焦点を当てる。我々の分析における中心的なツールは、統計学習理論からの擬似次元の概念である。
論文参考訳（メタデータ） (2025-01-24T13:13:50Z)
Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文参考訳（メタデータ） (2024-07-01T16:53:00Z)
Principal-Agent Multitasking: the Uniformity of Optimal Contracts and its Efficient Learning via Instrumental Regression [2.296475290901356]
本研究はマルチタスクプライマリエージェント問題を研究する。私はまず一様性の結果を示します。次に、各タスクの限界効用が不明な環境で研究します。
論文参考訳（メタデータ） (2024-05-31T07:01:49Z)
On the Necessity of Collaboration for Online Model Selection with Decentralized Data [53.244188985271606]
我々は,100万ドル以上の分散データを用いたオンラインモデル選択について検討し,クライアント間のコラボレーションの必要性について検討する。 i) クライアント上の計算コストが$o(K)$に制限された場合, (ii) クライアント上での計算制約がない場合, (i) 協調は不要であり, (ii) クライアント上での計算コストは$o(K)$に制限される。
論文参考訳（メタデータ） (2024-04-15T06:32:28Z)
Are Bounded Contracts Learnable and Approximately Optimal? [8.121834515103243]
本稿では,主エージェントが契約を用いてプロジェクトに取り組む動機付けを行う,主エージェント問題の隠れアクションモデルについて考察する。本研究では,有界決済契約が学習可能か,ほぼ最適かを検討する。
論文参考訳（メタデータ） (2024-02-22T12:19:19Z)
Contracting with a Learning Agent [32.950708673180436]
本研究では,学習エージェントとの繰り返し契約に関する研究を行い,結果が得られないエージェントに着目した。我々は、複数のアクション間のエージェントの選択が成功/失敗に繋がる正準契約設定において、この問題に対する最適解を実現する。我々の結果は、成功/失敗を超えて、プリンシパルが動的に再スケールする任意の非線形契約に一般化される。
論文参考訳（メタデータ） (2024-01-29T14:53:22Z)
Learning Optimal Contracts: How to Exploit Small Action Spaces [37.92189925462977]
本稿では、主目的が結果依存の支払い方式にコミットする主目的問題について検討する。約最適契約を高い確率で学習するアルゴリズムを設計する。また、関連するオンライン学習環境において、$tildemathcalO(T4/5)$ regret を提供するためにも使用できる。
論文参考訳（メタデータ） (2023-09-18T14:18:35Z)
Delegating Data Collection in Decentralized Machine Learning [67.0537668772372]
分散機械学習(ML)エコシステムの出現に動機付けられ,データ収集のデリゲートについて検討する。我々は、2つの基本的な情報非対称性を扱う最適でほぼ最適な契約を設計する。最適効用の1-1/e分を達成できるような単純な線形契約により、主成分がそのような非対称性に対処できることが示される。
論文参考訳（メタデータ） (2023-09-04T22:16:35Z)
Delegated Classification [21.384062337682185]
機械学習タスクのインセンティブ対応デリゲーションに関する理論的枠組みを提案する。予算最適契約を定義し、合理的な仮定の下で単純なしきい値を取ることを証明します。実証的に、我々は予算最適契約を小規模データを用いて構築できることを実証した。
論文参考訳（メタデータ） (2023-06-20T11:59:03Z)
Learning to Incentivize Information Acquisition: Proper Scoring Rules Meet Principal-Agent Model [64.94131130042275]
インセンティブ付き情報取得問題について検討し、主治官がエージェントを雇って代理情報を収集する。 UCBアルゴリズムをモデルに適合させる,実証可能なサンプル効率の良いアルゴリズムを設計する。本アルゴリズムは,主役の最適利益に対する微妙な推定手順と,所望のエージェントの行動にインセンティブを与える保守的な補正手法を特徴とする。
論文参考訳（メタデータ） (2023-03-15T13:40:16Z)
Minimalistic Predictions to Schedule Jobs with Online Precedence Constraints [117.8317521974783]
オンライン優先制約による非サーボ的スケジューリングについて検討する。アルゴリズムは、任意のジョブ依存に偏りがなく、前任者がすべて完了した場合に限り、ジョブについて学習する。
論文参考訳（メタデータ） (2023-01-30T13:17:15Z)
The Sample Complexity of Online Contract Design [120.9833763323407]
オンライン環境での隠れアクションの主エージェント問題について検討する。各ラウンドにおいて、主席は、各結果に基づいてエージェントへの支払いを指定する契約を投稿する。エージェントは、自身のユーティリティを最大化する戦略的な行動選択を行うが、プリンシパルによって直接観察できない。
論文参考訳（メタデータ） (2022-11-10T17:59:42Z)
Collective eXplainable AI: Explaining Cooperative Strategies and Agent Contribution in Multiagent Reinforcement Learning with Shapley Values [68.8204255655161]
本研究は,シェープリー値を用いたマルチエージェントRLにおける協調戦略を説明するための新しい手法を提案する。結果は、差別的でない意思決定、倫理的かつ責任あるAI由来の意思決定、公正な制約の下での政策決定に影響を及ぼす可能性がある。
論文参考訳（メタデータ） (2021-10-04T10:28:57Z)
Online Apprenticeship Learning [58.45089581278177]
見習い学習(AL)では、コスト関数にアクセスせずにマルコフ決定プロセス(MDP)が与えられます。目標は、事前に定義されたコスト関数のセットで専門家のパフォーマンスに一致するポリシーを見つけることです。ミラー下降型ノンレグレットアルゴリズムを2つ組み合わせることで,OAL問題を効果的に解くことができることを示す。
論文参考訳（メタデータ） (2021-02-13T12:57:51Z)
Physarum Powered Differentiable Linear Programming Layers and Applications [48.77235931652611]
一般線形プログラミング問題に対する効率的かつ微分可能な解法を提案する。本稿では,ビデオセグメンテーションタスクとメタラーニングにおける問題解決手法について述べる。
論文参考訳（メタデータ） (2020-04-30T01:50:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。