論文の概要: On multiagent online problems with predictions
- arxiv url: http://arxiv.org/abs/2507.12486v1
- Date: Tue, 15 Jul 2025 08:52:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 20:10:24.203302
- Title: On multiagent online problems with predictions
- Title(参考訳): 予測を伴うマルチエージェントオンライン問題について
- Authors: Gabriel Istrate, Cosmin Bonchis, Victor Bogdan,
- Abstract要約: マルチエージェント環境での予測による(競争的な)アルゴリズムのパワーについて検討する。
エージェントが将来の(自己)行動に1つの予測器を、他のプレイヤーの行動に1つの予測器を使用すると仮定する2つの予測器フレームワークを導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the power of (competitive) algorithms with predictions in a multiagent setting. We introduce a two predictor framework, that assumes that agents use one predictor for their future (self) behavior, and one for the behavior of the other players. The main problem we are concerned with is understanding what are the best competitive ratios that can be achieved by employing such predictors, under various assumptions on predictor quality. As an illustration of our framework, we introduce and analyze a multiagent version of the ski-rental problem. In this problem agents can collaborate by pooling resources to get a group license for some asset. If the license price is not met then agents have to rent the asset individually for the day at a unit price. Otherwise the license becomes available forever to everyone at no extra cost. In the particular case of perfect other predictions the algorithm that follows the self predictor is optimal but not robust to mispredictions of agent's future behavior; we give an algorithm with better robustness properties and benchmark it.
- Abstract(参考訳): マルチエージェント環境での予測による(競争的な)アルゴリズムのパワーについて検討する。
エージェントが将来の(自己)行動に1つの予測器を、他のプレイヤーの行動に1つの予測器を使用すると仮定する2つの予測器フレームワークを導入する。
私たちが懸念している主な問題は、予測器の品質に関する様々な仮定の下で、そのような予測器を利用することで達成できる最高の競争比率が何であるかを理解することです。
筆者らのフレームワークの例証として,スキーレンタル問題のマルチエージェント版を紹介し,分析する。
この問題では、エージェントはリソースをプールすることで協力して、ある資産のグループライセンスを得ることができます。
ライセンス価格が満たされていない場合は、エージェントは単価で1日に個別に資産を借りなければならない。
そうでなければ、ライセンスは、余分なコストなしで、誰にでも永久に利用できるようになる。
完全な他の予測の場合、自己予測器に従うアルゴリズムは最適であるが、エージェントの将来の振る舞いの誤予測には頑健ではない。
関連論文リスト
- Competitive Algorithms for Cooperative Multi-Agent Ski-Rental Problems [35.95355517827071]
本稿では,従来のスキーレンタルジレンマをグループ設定に一般化する,新しいマルチエージェントスキーレンタル問題を提案する。
我々のモデルでは、各エージェントは固定された日代でレンタルするか、個別のコストでパスを購入することができる。
我々はエージェントのアクティブな時代が異なり、エージェントが意思決定プロセスから抜け出すと動的状態につながるシナリオを考察する。
論文 参考訳(メタデータ) (2025-07-21T15:36:34Z) - Performative Prediction on Games and Mechanism Design [69.7933059664256]
エージェントが過去の正確性に基づいて予測を信頼するかを判断する集団リスクジレンマについて検討する。
予測が集合的な結果を形成するにつれて、社会福祉は関心の指標として自然に現れる。
よりよいトレードオフを実現し、それらをメカニズム設計に使用する方法を示します。
論文 参考訳(メタデータ) (2024-08-09T16:03:44Z) - Best of Many in Both Worlds: Online Resource Allocation with Predictions under Unknown Arrival Model [16.466711636334587]
オンライン意思決定者は、到着や要求など、将来の変数に関する予測を得ることが多い。
意思決定者にとって予測精度は未知であるため、予測に盲目的に追従することは有害である。
我々は未知の予測精度に頑健な方法で予測を利用するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-21T04:57:32Z) - Refined Sample Complexity for Markov Games with Independent Linear Function Approximation [49.5660193419984]
マルコフゲーム(MG)はマルチエージェント強化学習(MARL)の重要なモデルである
本稿では、WangらによるAVLPRフレームワークを改良し(2023年)、最適部分ギャップの悲観的推定を設計する。
マルチエージェントの呪いに取り組み、最適な$O(T-1/2)収束率を達成し、同時に$textpoly(A_max)$依存性を避ける最初のアルゴリズムを与える。
論文 参考訳(メタデータ) (2024-02-11T01:51:15Z) - CAMMARL: Conformal Action Modeling in Multi Agent Reinforcement Learning [5.865719902445064]
本稿では,新しいマルチエージェント強化学習アルゴリズムCAMMARLを提案する。
それは、異なる状況における他のエージェントのアクションを、自信集合の形でモデル化することを含む。
本稿では,CAMMARLが共形予測セットをモデル化することにより,MARLにおける自律エージェントの能力を高めることを示す。
論文 参考訳(メタデータ) (2023-06-19T19:03:53Z) - QCNeXt: A Next-Generation Framework For Joint Multi-Agent Trajectory
Prediction [5.312631388611489]
路上エージェントの将来の軌跡の同時分布を推定することは自動運転に不可欠である。
本稿では,QCNeXtと呼ばれるマルチエージェント軌道予測のための次世代フレームワークを提案する。
提案手法はArgoverse 2マルチエージェント動作予測ベンチマークで1位である。
論文 参考訳(メタデータ) (2023-06-18T09:40:40Z) - Mixing predictions for online metric algorithms [34.849039387367455]
我々は予測を組み合わせるアルゴリズムを設計し、このような動的組み合わせと競合する。
我々のアルゴリズムは、バンディットのような方法で予測者にアクセスするように適応することができ、一度に1つの予測者しかクエリできない。
我々の下界の1つが予想外の意味を持つのは、$k$-server問題に対する定式化のカバーに関する新しい構造的洞察である。
論文 参考訳(メタデータ) (2023-04-04T13:18:00Z) - Bandit Social Learning: Exploration under Myopic Behavior [54.767961587919075]
オンラインプラットフォーム上でのレビューによって動機付けられた社会学習のダイナミクスについて検討する。
エージェントはまとめて単純なマルチアームのバンディットプロトコルに従うが、各エージェントは探索を伴わずにミオプティカルに振る舞う。
このような振る舞いに対して,スターク学習の失敗を導出し,好意的な結果を提供する。
論文 参考訳(メタデータ) (2023-02-15T01:57:57Z) - Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting [61.02295959343446]
この研究はまず、相互作用モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。
我々は、回帰と不確実性推定の両方を行うために、元の置換同変不確かさ推定器を備えた一般的なCU対応回帰フレームワークを構築した。
提案するフレームワークを,プラグインモジュールとして現在のSOTAマルチエージェント軌道予測システムに適用する。
論文 参考訳(メタデータ) (2022-07-11T21:17:41Z) - What Should I Know? Using Meta-gradient Descent for Predictive Feature
Discovery in a Single Stream of Experience [63.75363908696257]
計算強化学習は、未来の感覚の予測を通じて、エージェントの世界の知覚を構築しようとする。
この一連の作業において、オープンな課題は、エージェントがどの予測が意思決定を最も支援できるかを、無限に多くの予測から決定することである。
本稿では,エージェントが何を予測するかを学習するメタ段階的な降下過程,(2)選択した予測の見積もり,3)将来の報酬を最大化するポリシーを生成する方法を紹介する。
論文 参考訳(メタデータ) (2022-06-13T21:31:06Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。