論文の概要: The Platform Design Problem
- arxiv url: http://arxiv.org/abs/2009.06117v2
- Date: Tue, 13 Jul 2021 02:14:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 03:23:11.562895
- Title: The Platform Design Problem
- Title(参考訳): プラットフォーム設計の問題
- Authors: Christos Papadimitriou, Kiran Vodrahalli, Mihalis Yannakakis
- Abstract要約: オンライン企業はソフトウェアプラットフォームのスイートをデプロイし、各プラットフォームは特定のアクティビティ中にユーザと対話するように設計されている。
私たちはこのインタラクションを、デザイナと1つ以上のエージェントの間のStackelbergゲームとしてモデル化します。
デザイナの効用は、プラットフォームの開発コストを抑えた、アクセス可能な状態の定常状態確率の線形関数である。
- 参考スコア(独自算出の注目度): 3.624885549132002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: On-line firms deploy suites of software platforms, where each platform is
designed to interact with users during a certain activity, such as browsing,
chatting, socializing, emailing, driving, etc. The economic and incentive
structure of this exchange, as well as its algorithmic nature, have not been
explored to our knowledge. We model this interaction as a Stackelberg game
between a Designer and one or more Agents. We model an Agent as a Markov chain
whose states are activities; we assume that the Agent's utility is a linear
function of the steady-state distribution of this chain. The Designer may
design a platform for each of these activities/states; if a platform is adopted
by the Agent, the transition probabilities of the Markov chain are affected,
and so is the objective of the Agent. The Designer's utility is a linear
function of the steady state probabilities of the accessible states minus the
development cost of the platforms. The underlying optimization problem of the
Agent -- how to choose the states for which to adopt the platform -- is an MDP.
If this MDP has a simple yet plausible structure (the transition probabilities
from one state to another only depend on the target state and the recurrent
probability of the current state) the Agent's problem can be solved by a greedy
algorithm. The Designer's optimization problem (designing a custom suite for
the Agent so as to optimize, through the Agent's optimum reaction, the
Designer's revenue), is NP-hard to approximate within any finite ratio;
however, the special case, while still NP-hard, has an FPTAS. These results
generalize from a single Agent to a distribution of Agents with finite support,
as well as to the setting where the Designer must find the best response to the
existing strategies of other Designers. We discuss other implications of our
results and directions of future research.
- Abstract(参考訳): オンライン企業はソフトウェアプラットフォームのスイートをデプロイし、各プラットフォームはブラウジング、チャット、ソーシャル化、メール、運転など、特定のアクティビティ中にユーザーと対話するように設計されている。
この交換の経済構造とインセンティブ構造とそのアルゴリズム的性質は、我々の知識には探求されていない。
このインタラクションを、デザイナーと1つ以上のエージェントの間のstackelbergゲームとしてモデル化します。
我々は、状態が活性であるマルコフ連鎖としてエージェントをモデル化し、エージェントの効用はこのチェーンの定常分布の線型関数であると仮定する。
設計者は、これらのアクティビティ/状態ごとにプラットフォームを設計することができ、もしあるプラットフォームがエージェントによって採用された場合、マルコフ連鎖の遷移確率は影響を受け、エージェントの目的も同様である。
設計者のユーティリティは、アクセス可能な状態の定常状態確率の線形関数であり、プラットフォームの開発コストを減少させる。
Agentの根底にある最適化問題 -- プラットフォームを採用する状態をどのように選択するか -- は、MDPである。
このmdpが単純かつ妥当な構造(ある状態から別の状態への遷移確率は、対象の状態と現在の状態の再帰確率にのみ依存する)を持つ場合、エージェントの問題はgreedyアルゴリズムによって解くことができる。
デザイナーの最適化問題(エージェントの最適反応、デザイナーの収入を最適化するためにエージェントのカスタムスイートを設計する)は、任意の有限比で近似するのは難しいが、特別な場合はまだnpハードであるが、fptasを持っている。
これらの結果は、単一のエージェントから有限のサポートを持つエージェントの分布まで一般化し、また、設計者が他の設計者の既存の戦略に対する最良の反応を見つけなければならない設定へと一般化する。
今後の研究の成果と方向性について論じる。
関連論文リスト
- Intention-aware policy graphs: answering what, how, and why in opaque agents [0.1398098625978622]
エージェントは、複雑な環境で相互作用し、創発的行動の可能性を高める、AIベースの特殊なソフトウェアである。
本稿では,確率的グラフィカルモデルと,そのようなモデル設計のためのパイプラインを提案する。
提案する説明の解釈可能性および信頼性を評価するために,提案手法を貢献する。
このモデルは、エージェントの行動と世界状態の一部を観察することで構築することができる。
論文 参考訳(メタデータ) (2024-09-27T09:31:45Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文 参考訳(メタデータ) (2022-11-04T16:10:50Z) - Decentralized scheduling through an adaptive, trading-based multi-agent
system [1.7403133838762448]
多エージェント強化学習システムでは、あるエージェントの動作が他のエージェントの報酬に悪影響を及ぼす可能性がある。
この作業は、エージェントが入ってくるジョブをコアに割り当てる責任を負うシミュレーションスケジューリング環境に、トレーディングアプローチを適用します。
エージェントは計算コアの使用権を交換して、低優先度で低報酬のジョブよりも高速に、高利益のジョブを処理できる。
論文 参考訳(メタデータ) (2022-07-05T13:50:18Z) - Formalizing the Problem of Side Effect Regularization [81.97441214404247]
本稿では,補助ゲームフレームワークを用いたサイドエフェクト正規化のための公式な基準を提案する。
これらのゲームでは、エージェントは部分的に観測可能なマルコフ決定プロセスを解決する。
このPOMDPは、エージェントが将来的なタスクをこなす能力と、プロキシ報酬を交換することで解決されることを示す。
論文 参考訳(メタデータ) (2022-06-23T16:36:13Z) - Transform2Act: Learning a Transform-and-Control Policy for Efficient
Agent Design [31.33251581287337]
エージェントの機能は、その設計、すなわち骨格構造と関節特性によって決定される。
与えられた関数に対する最適なエージェント設計を見つけることは、本質的に問題であり、設計空間が禁断に大きいため、非常に難しい。
これらの問題に対処するため、我々はエージェントの設計手順を意思決定プロセスに組み込むことを目標としています。
論文 参考訳(メタデータ) (2021-10-07T17:51:05Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - HOME: Heatmap Output for future Motion Estimation [2.424910201171407]
Homeは、エージェントの将来の位置の確率分布を表す画像出力を用いて、モーション予測問題に対処するフレームワークである。
提案手法をArgoverse Motion Forecasting Benchmarkに適用し,オンラインリーダーボード上で1位を獲得した。
論文 参考訳(メタデータ) (2021-05-23T16:27:04Z) - AgentFormer: Agent-Aware Transformers for Socio-Temporal Multi-Agent
Forecasting [25.151713845738335]
我々は、時間と社会的次元を共同でモデル化する新しいトランスフォーマー、AgentFormerを提案する。
エージェントフォーマに基づいて,任意のエージェントの特徴に任意の時間ステップで対応可能なマルチエージェント軌道予測モデルを提案する。
提案手法は,歩行者および自律運転用データセットにおける技術状況を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-25T17:59:01Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。