Fugu-MT 論文翻訳(概要): The Platform Design Problem

論文の概要: The Platform Design Problem

arxiv url: http://arxiv.org/abs/2009.06117v2
Date: Tue, 13 Jul 2021 02:14:44 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-19 03:23:11.562895
Title: The Platform Design Problem
Title（参考訳）: プラットフォーム設計の問題
Authors: Christos Papadimitriou, Kiran Vodrahalli, Mihalis Yannakakis
Abstract要約: オンライン企業はソフトウェアプラットフォームのスイートをデプロイし、各プラットフォームは特定のアクティビティ中にユーザと対話するように設計されている。私たちはこのインタラクションを、デザイナと1つ以上のエージェントの間のStackelbergゲームとしてモデル化します。デザイナの効用は、プラットフォームの開発コストを抑えた、アクセス可能な状態の定常状態確率の線形関数である。
参考スコア（独自算出の注目度）: 3.624885549132002
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: On-line firms deploy suites of software platforms, where each platform is designed to interact with users during a certain activity, such as browsing, chatting, socializing, emailing, driving, etc. The economic and incentive structure of this exchange, as well as its algorithmic nature, have not been explored to our knowledge. We model this interaction as a Stackelberg game between a Designer and one or more Agents. We model an Agent as a Markov chain whose states are activities; we assume that the Agent's utility is a linear function of the steady-state distribution of this chain. The Designer may design a platform for each of these activities/states; if a platform is adopted by the Agent, the transition probabilities of the Markov chain are affected, and so is the objective of the Agent. The Designer's utility is a linear function of the steady state probabilities of the accessible states minus the development cost of the platforms. The underlying optimization problem of the Agent -- how to choose the states for which to adopt the platform -- is an MDP. If this MDP has a simple yet plausible structure (the transition probabilities from one state to another only depend on the target state and the recurrent probability of the current state) the Agent's problem can be solved by a greedy algorithm. The Designer's optimization problem (designing a custom suite for the Agent so as to optimize, through the Agent's optimum reaction, the Designer's revenue), is NP-hard to approximate within any finite ratio; however, the special case, while still NP-hard, has an FPTAS. These results generalize from a single Agent to a distribution of Agents with finite support, as well as to the setting where the Designer must find the best response to the existing strategies of other Designers. We discuss other implications of our results and directions of future research.
Abstract（参考訳）: オンライン企業はソフトウェアプラットフォームのスイートをデプロイし、各プラットフォームはブラウジング、チャット、ソーシャル化、メール、運転など、特定のアクティビティ中にユーザーと対話するように設計されている。この交換の経済構造とインセンティブ構造とそのアルゴリズム的性質は、我々の知識には探求されていない。このインタラクションを、デザイナーと1つ以上のエージェントの間のstackelbergゲームとしてモデル化します。我々は、状態が活性であるマルコフ連鎖としてエージェントをモデル化し、エージェントの効用はこのチェーンの定常分布の線型関数であると仮定する。設計者は、これらのアクティビティ/状態ごとにプラットフォームを設計することができ、もしあるプラットフォームがエージェントによって採用された場合、マルコフ連鎖の遷移確率は影響を受け、エージェントの目的も同様である。設計者のユーティリティは、アクセス可能な状態の定常状態確率の線形関数であり、プラットフォームの開発コストを減少させる。 Agentの根底にある最適化問題 -- プラットフォームを採用する状態をどのように選択するか -- は、MDPである。このmdpが単純かつ妥当な構造(ある状態から別の状態への遷移確率は、対象の状態と現在の状態の再帰確率にのみ依存する)を持つ場合、エージェントの問題はgreedyアルゴリズムによって解くことができる。デザイナーの最適化問題(エージェントの最適反応、デザイナーの収入を最適化するためにエージェントのカスタムスイートを設計する)は、任意の有限比で近似するのは難しいが、特別な場合はまだnpハードであるが、fptasを持っている。これらの結果は、単一のエージェントから有限のサポートを持つエージェントの分布まで一般化し、また、設計者が他の設計者の既存の戦略に対する最良の反応を見つけなければならない設定へと一般化する。今後の研究の成果と方向性について論じる。

関連論文リスト

BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization [41.08366028094234]
大規模言語モデル(LLM)は、現実世界のソフトウェア工学の問題を一般化するのに苦労する。既存のシステムはワークフロー全体の問題を処理するために、単一のエージェントに依存することが多い。人間の技術者が複雑な問題を分解する方法に触発され、我々はSWEエージェントをオーケストラとして構成し、特殊なサブエージェントをコーディネートすることを提案する。
論文参考訳（メタデータ） (2025-12-29T17:41:11Z)
Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。 BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文参考訳（メタデータ） (2025-12-20T12:06:13Z)
How can we assess human-agent interactions? Case studies in software agent design [52.953425368394306]
我々は,人間とエージェントの相互作用の厳密な評価に向けて,二つの大きな一歩を踏み出した。エージェント設計のより効率的な人間中心評価のためのフレームワークであるPULSEを提案する。私たちは、オープンソースのソフトウェアエージェントOpenHandsを中心に構築された大規模なWebプラットフォームにフレームワークをデプロイします。
論文参考訳（メタデータ） (2025-10-10T19:04:28Z)
Inefficiencies of Meta Agents for Agent Design [25.46718879564119]
メタエージェントの共通クラスにおける3つの課題について検討する。まず、メタエージェントがイテレーション間でどのように学習するかを検討する。第二に、メタエージェントはトレーニング中に複数のエージェントを設計するが、通常、テスト時に単一のエージェントをコミットする。
論文参考訳（メタデータ） (2025-10-08T07:06:17Z)
AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文参考訳（メタデータ） (2025-10-06T23:20:49Z)
Anemoi: A Semi-Centralized Multi-agent System Based on Agent-to-Agent Communication MCP server from Coral Protocol [0.7288110873705294]
Anemoi は、Coral Protocol の Agent-to-Agent (A2A) 通信 MCP サーバ上に構築された、半集中型の MAS である。従来のデザインとは異なり、Anemoiは構造的かつ直接的なエージェント間コラボレーションを可能にし、すべてのエージェントが進捗を監視し、結果を評価し、ボトルネックを特定し、リアルタイムに改善を提案する。
論文参考訳（メタデータ） (2025-08-23T15:45:10Z)
When Agents Break Down in Multiagent Path Finding [0.0]
我々は、一部のエージェントが誤動作による遅延を経験するシナリオを形式的にモデル化する新しい変種を導入する。本稿では,完全な計画変更に依存しない動的スケジュール適応のためのフレームワークを提案する。第一の通信プロトコルに従えば、k の誤動作後のメイスパンの増加は k の余分な回転によって制限されることを示す。
論文参考訳（メタデータ） (2025-08-05T12:59:30Z)
Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation [72.44384066166147]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は、多様な領域にわたる複雑な問題を扱うための強力なソリューションとして登場した。既存のアプローチは、事前に定義されたエージェントセットとハードコードされた相互作用構造を持つテンプレートグラフ修正パラダイムに依存しているため、基本的に制限されている。協調グラフをスクラッチから構築することで、このパラダイムを運用する新しい自己回帰モデルであるARG-Designerを提案する。
論文参考訳（メタデータ） (2025-07-24T09:17:41Z)
The Real Barrier to LLM Agent Usability is Agentic ROI [110.31127571114635]
大規模言語モデル(LLM)エージェントは、人間とAIの相互作用において有望な変化を示す。我々は、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティギャップを強調します。
論文参考訳（メタデータ） (2025-05-23T11:40:58Z)
Towards Adaptive Software Agents for Debugging [0.40964539027092917]
本稿では,エージェントの数とその役割を動的に決定する適応型エージェント設計を提案する。最初の評価では、適応設計では、生成されるエージェントの数はバグのあるコードの複雑さに依存することが示されている。治療効果は, ワンショットプロンプトよりも平均11%改善した。
論文参考訳（メタデータ） (2025-04-25T12:48:08Z)
Intention-aware policy graphs: answering what, how, and why in opaque agents [0.1398098625978622]
エージェントは、複雑な環境で相互作用し、創発的行動の可能性を高める、AIベースの特殊なソフトウェアである。本稿では,確率的グラフィカルモデルと,そのようなモデル設計のためのパイプラインを提案する。提案する説明の解釈可能性および信頼性を評価するために,提案手法を貢献する。このモデルは、エージェントの行動と世界状態の一部を観察することで構築することができる。
論文参考訳（メタデータ） (2024-09-27T09:31:45Z)
AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文参考訳（メタデータ） (2024-02-21T04:11:28Z)
Multi-Agent Reinforcement Learning for Microprocessor Design Space Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文参考訳（メタデータ） (2022-11-29T17:10:24Z)
GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文参考訳（メタデータ） (2022-11-04T16:10:50Z)
Decentralized scheduling through an adaptive, trading-based multi-agent system [1.7403133838762448]
多エージェント強化学習システムでは、あるエージェントの動作が他のエージェントの報酬に悪影響を及ぼす可能性がある。この作業は、エージェントが入ってくるジョブをコアに割り当てる責任を負うシミュレーションスケジューリング環境に、トレーディングアプローチを適用します。エージェントは計算コアの使用権を交換して、低優先度で低報酬のジョブよりも高速に、高利益のジョブを処理できる。
論文参考訳（メタデータ） (2022-07-05T13:50:18Z)
Formalizing the Problem of Side Effect Regularization [81.97441214404247]
本稿では,補助ゲームフレームワークを用いたサイドエフェクト正規化のための公式な基準を提案する。これらのゲームでは、エージェントは部分的に観測可能なマルコフ決定プロセスを解決する。このPOMDPは、エージェントが将来的なタスクをこなす能力と、プロキシ報酬を交換することで解決されることを示す。
論文参考訳（メタデータ） (2022-06-23T16:36:13Z)
Transform2Act: Learning a Transform-and-Control Policy for Efficient Agent Design [31.33251581287337]
エージェントの機能は、その設計、すなわち骨格構造と関節特性によって決定される。与えられた関数に対する最適なエージェント設計を見つけることは、本質的に問題であり、設計空間が禁断に大きいため、非常に難しい。これらの問題に対処するため、我々はエージェントの設計手順を意思決定プロセスに組み込むことを目標としています。
論文参考訳（メタデータ） (2021-10-07T17:51:05Z)
Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文参考訳（メタデータ） (2021-10-04T06:53:59Z)
HOME: Heatmap Output for future Motion Estimation [2.424910201171407]
Homeは、エージェントの将来の位置の確率分布を表す画像出力を用いて、モーション予測問題に対処するフレームワークである。提案手法をArgoverse Motion Forecasting Benchmarkに適用し,オンラインリーダーボード上で1位を獲得した。
論文参考訳（メタデータ） (2021-05-23T16:27:04Z)
AgentFormer: Agent-Aware Transformers for Socio-Temporal Multi-Agent Forecasting [25.151713845738335]
我々は、時間と社会的次元を共同でモデル化する新しいトランスフォーマー、AgentFormerを提案する。エージェントフォーマに基づいて,任意のエージェントの特徴に任意の時間ステップで対応可能なマルチエージェント軌道予測モデルを提案する。提案手法は,歩行者および自律運転用データセットにおける技術状況を大幅に改善する。
論文参考訳（メタデータ） (2021-03-25T17:59:01Z)
Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文参考訳（メタデータ） (2020-08-07T06:35:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。