Fugu-MT 論文翻訳(概要): A utility-based analysis of equilibria in multi-objective normal form games

論文の概要: A utility-based analysis of equilibria in multi-objective normal form games

arxiv url: http://arxiv.org/abs/2001.08177v1
Date: Fri, 17 Jan 2020 22:27:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-10 09:58:22.703264
Title: A utility-based analysis of equilibria in multi-objective normal form games
Title（参考訳）: 多目的正規形ゲームにおける効用に基づく平衡解析
Authors: Roxana R\u{a}dulescu, Patrick Mannion, Yijie Zhang, Diederik M. Roijers, and Ann Now\'e
Abstract要約: 我々は、MOMASにおける競合する目的間の妥協は、システムのユーザにとってこれらの妥協が持つ実用性に基づいて分析されるべきである、と論じる。このユーティリティベースのアプローチは、MOMAS内のエージェントに対する2つの異なる最適化基準を自然に導く。非線型効用関数を用いる場合、最適化基準の選択はMONFGにおける平衡の集合を根本的に変更できることを示す。
参考スコア（独自算出の注目度）: 4.632366780742502
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In multi-objective multi-agent systems (MOMAS), agents explicitly consider the possible tradeoffs between conflicting objective functions. We argue that compromises between competing objectives in MOMAS should be analysed on the basis of the utility that these compromises have for the users of a system, where an agent's utility function maps their payoff vectors to scalar utility values. This utility-based approach naturally leads to two different optimisation criteria for agents in a MOMAS: expected scalarised returns (ESR) and scalarised expected returns (SER). In this article, we explore the differences between these two criteria using the framework of multi-objective normal form games (MONFGs). We demonstrate that the choice of optimisation criterion (ESR or SER) can radically alter the set of equilibria in a MONFG when non-linear utility functions are used.
Abstract（参考訳）: 多目的マルチエージェントシステム(MOMAS)では、エージェントは競合する目的関数間のトレードオフを明示的に考慮する。 MOMASにおける競合する目的間の妥協は、エージェントのユーティリティ関数が彼らの支払ベクトルをスカラーなユーティリティ値にマッピングするシステムのユーザに対して、これらの妥協が持つユーティリティに基づいて分析されるべきである。このユーティリティベースのアプローチは、MOMAS内のエージェントに対する2つの異なる最適化基準(予測スカラー化リターン(ESR)とスカラー化期待リターン(SER))を自然に導く。本稿では,多目的正規形ゲーム(monfgs)の枠組みを用いて,これら2つの基準の違いについて考察する。非線型効用関数を用いる場合、最適化基準(ESRまたはSER)の選択はMONFGにおける平衡の集合を根本的に変更できることを示す。

関連論文リスト

UC-MOA: Utility-Conditioned Multi-Objective Alignment for Distributional Pareto-Optimality [52.49062565901046]
Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の価値を整合させる基盤となっている。既存のアプローチは、人間の好みの多次元、分布的なニュアンスを捉えるのに苦労している。本稿では,これらの制約を克服する新しいフレームワークであるUtility-Conditioned Multi-Objective Alignment (UC-MOA)を紹介する。
論文参考訳（メタデータ） (2025-03-10T09:52:42Z)
Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。数発のステアライメントのための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-12-18T16:14:59Z)
LLM-based Bi-level Multi-interest Learning Framework for Sequential Recommendation [54.396000434574454]
本稿では,暗黙的行動と明示的意味論的視点を組み合わせた新しい多目的SRフレームワークを提案する。 Implicit Behavioral Interest ModuleとExplicit Semantic Interest Moduleの2つのモジュールが含まれている。 4つの実世界のデータセットの実験は、フレームワークの有効性と実用性を検証する。
論文参考訳（メタデータ） (2024-11-14T13:00:23Z)
LLM-enhanced Reranking in Recommender Systems [49.969932092129305]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文参考訳（メタデータ） (2024-06-18T09:29:18Z)
A Unifying Framework for Action-Conditional Self-Predictive Reinforcement Learning [48.59516337905877]
優れた表現を学ぶことは、強化学習(RL)エージェントにとって重要な課題である。近年の研究では、これらのアルゴリズムに関する理論的洞察が生まれている。我々は,行動条件の自己予測的目的を分析することによって,理論と実践のギャップを埋める一歩を踏み出した。
論文参考訳（メタデータ） (2024-06-04T07:22:12Z)
UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [75.11267478778295]
マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。重みベクトル w でパラメータ化される線型効用関数の場合に焦点を当てる。学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文参考訳（メタデータ） (2024-05-01T09:34:42Z)
Value function interference and greedy action selection in value-based multi-objective reinforcement learning [1.4206639868377509]
多目的強化学習(MORL)アルゴリズムは従来の強化学習(RL)を拡張するユーザのユーティリティ関数が、ベクター値と類似のユーティリティレベルを幅広くマップしている場合、これは干渉を引き起こす可能性があることを示す。我々は、欲求行動を特定する際にランダムなタイブレークを避けることは、値関数の干渉によって生じる問題を改善できるが、完全には克服できないことを実証的に示す。
論文参考訳（メタデータ） (2024-02-09T09:28:01Z)
Multi-Objective GFlowNets [59.16787189214784]
本稿では,多目的最適化の文脈において,多様な候補を生成する問題について検討する。薬物発見やマテリアルデザインといった機械学習の多くの応用において、目標は、競合する可能性のある目標のセットを同時に最適化する候補を生成することである。 GFlowNetsをベースとした多目的GFlowNets(MOGFNs)を提案する。
論文参考訳（メタデータ） (2022-10-23T16:15:36Z)
Multi-Target XGBoostLSS Regression [91.3755431537592]
本稿では,複数の目標とその依存関係を確率論的回帰設定でモデル化するXGBoostLSSの拡張について述べる。提案手法は,既存のGBMよりも実行時の方が優れており,精度も良好に比較できる。
論文参考訳（メタデータ） (2022-10-13T08:26:14Z)
Multi-Objective Coordination Graphs for the Expected Scalarised Returns with Generative Flow Models [2.7648976108201815]
現実世界の問題を解決する鍵は、エージェント間の疎結合構造を利用することである。風力発電の制御においては、電力の最大化とシステムコンポーネントのストレスの最小化の間にトレードオフが存在する。エージェント間の疎結合を多目的協調グラフ(MO-CoG)としてモデル化する。
論文参考訳（メタデータ） (2022-07-01T12:10:15Z)
Mono-surrogate vs Multi-surrogate in Multi-objective Bayesian Optimisation [0.0]
目的関数毎に代理モデルを構築し、スカラー化関数分布がガウス的でないことを示す。標準ベンチマークや実世界の最適化問題に対する既存手法との比較は,マルチサロゲート方式の可能性を示している。
論文参考訳（メタデータ） (2022-05-02T09:25:04Z)
R-MBO: A Multi-surrogate Approach for Preference Incorporation in Multi-objective Bayesian Optimisation [0.0]
本稿では,多目的BOにおける意思決定者の嗜好として,目的関数を目的関数値に組み込むための,a-priori Multi-surrogateアプローチを提案する。ベンチマークと実世界の最適化問題に対する既存モノ代理手法との比較は,提案手法の可能性を示している。
論文参考訳（メタデータ） (2022-04-27T19:58:26Z)
Opponent Learning Awareness and Modelling in Multi-Objective Normal Form Games [5.0238343960165155]
エージェントはシステム内の他のエージェントの振る舞いについて学ぶことが不可欠である。本稿では,非線形ユーティリティとの多目的マルチエージェント相互作用に対する,このようなモデリングの効果について述べる。
論文参考訳（メタデータ） (2020-11-14T12:35:32Z)
Randomized Entity-wise Factorization for Multi-Agent Reinforcement Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文参考訳（メタデータ） (2020-06-07T18:28:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。