Fugu-MT 論文翻訳(概要): PMGDA: A Preference-based Multiple Gradient Descent Algorithm

論文の概要: PMGDA: A Preference-based Multiple Gradient Descent Algorithm

arxiv url: http://arxiv.org/abs/2402.09492v2
Date: Fri, 16 Feb 2024 14:01:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-19 12:39:29.799813
Title: PMGDA: A Preference-based Multiple Gradient Descent Algorithm
Title（参考訳）: pmgda:選好に基づく多重勾配降下アルゴリズム
Authors: Xiaoyuan Zhang and Xi Lin and Qingfu Zhang
Abstract要約: マルチタスク学習のような、多くの多目的機械学習アプリケーションにおいて、意思決定者の所定の好みに合ったソリューションを見つけることが望ましい。本稿では,意思決定者の好みに合ったソリューションを見つけるための,新しい予測と修正のためのフレームワークを提案する。
参考スコア（独自算出の注目度）: 12.600588000788214
License: http://creativecommons.org/licenses/by/4.0/
Abstract: It is desirable in many multi-objective machine learning applications, such as multi-task learning with conflicting objectives and multi-objective reinforcement learning, to find a Pareto solution that can match a given preference of a decision maker. These problems are often large-scale with available gradient information but cannot be handled very well by the existing algorithms. To tackle this critical issue, this paper proposes a novel predict-and-correct framework for locating a Pareto solution that fits the preference of a decision maker. In the proposed framework, a constraint function is introduced in the search progress to align the solution with a user-specific preference, which can be optimized simultaneously with multiple objective functions. Experimental results show that our proposed method can efficiently find a particular Pareto solution under the demand of a decision maker for standard multiobjective benchmark, multi-task learning, and multi-objective reinforcement learning problems with more than thousands of decision variables. Code is available at: https://github.com/xzhang2523/pmgda. Our code is current provided in the pgmda.rar attached file and will be open-sourced after publication.}
Abstract（参考訳）: 競合する目的を持つマルチタスク学習や多目的強化学習など、多くの多目的機械学習アプリケーションにおいて、意思決定者の所定の好みに合うパレートソリューションを見つけることが望ましい。これらの問題は、しばしば利用可能な勾配情報を持つ大規模であるが、既存のアルゴリズムではうまく扱えない。この問題に取り組むため,本稿では,意思決定者の好みに合致したparetoソリューションを見つけるための新しい予測・修正フレームワークを提案する。提案フレームワークでは,複数の目的関数と同時最適化可能なユーザ固有の選好にソリューションを整合させるために,探索進行に制約関数を導入する。実験の結果,提案手法は,標準多目的ベンチマーク,マルチタスク学習,および数千以上の決定変数を持つ多目的強化学習問題に対する意思決定者の要求に応じて,特定のパレート解を効率的に見つけることができることがわかった。コードはhttps://github.com/xzhang2523/pmgda。私たちのコードは現在のpgmda.rarアタッチメントファイルで提供されており、公開後にオープンソース化されます。 }

関連論文リスト

MO-MIX: Multi-Objective Multi-Agent Cooperative Decision-Making With Deep Reinforcement Learning [68.91090643731987]
深部強化学習(RL)は複雑な意思決定問題を解決するために広く応用されている。既存のアプローチは、別々のフィールドに限られており、単一の目的でマルチエージェントの意思決定しか処理できない。マルチオブジェクト型マルチエージェント強化学習(MOMARL)問題の解法としてMO-mixを提案する。
論文参考訳（メタデータ） (2026-02-28T16:25:22Z)
Limitations of Scalarisation in MORL: A Comparative Study in Discrete Environments [0.0]
本研究では,多目的強化学習(MORL)アルゴリズムを個別の行動空間と観測空間にわたって検討した。我々は,外部ループ型マルチポリシー手法を用いて,基礎的な単一ポリシーMORLアルゴリズムMO Q-Learningの性能を評価する。
論文参考訳（メタデータ） (2025-11-20T15:45:50Z)
Gradient-Based Multi-Objective Deep Learning: Algorithms, Theories, Applications, and Beyond [35.78910104369677]
本稿では,多目的深層学習のための勾配に基づく手法を包括的に調査する。既存のアルゴリズムを出力に基づいて体系的に分類する。この分類に加えて、この調査は理論分析、重要な応用、実践的資源をカバーし、今後の研究に向けたオープンな課題と有望な方向性を強調している。
論文参考訳（メタデータ） (2025-01-19T04:56:55Z)
FERERO: A Flexible Framework for Preference-Guided Multi-Objective Learning [41.95837632934815]
pREfeRence-guided Multi-Objective Learning (FERERO) のためのフレキシブルフラムワークを提案する。この問題を解決するために、収束アルゴリズムは単一ループと原始変種の両方で開発される。複数のベンチマーク実験により、提案手法は優先誘導最適解の探索に非常に適していることが示された。
論文参考訳（メタデータ） (2024-12-02T18:21:16Z)
Towards Efficient Pareto Set Approximation via Mixture of Experts Based Model Fusion [53.33473557562837]
大規模深層ニューラルネットワークに対する多目的最適化問題を解くことは、損失ランドスケープの複雑さと高価な計算コストのために難しい課題である。本稿では,専門家(MoE)をベースとしたモデル融合を用いて,この問題を実用的でスケーラブルに解決する手法を提案する。特殊な単一タスクモデルの重みをまとめることで、MoEモジュールは複数の目的間のトレードオフを効果的に捉えることができる。
論文参考訳（メタデータ） (2024-06-14T07:16:18Z)
UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [75.11267478778295]
マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。重みベクトル w でパラメータ化される線型効用関数の場合に焦点を当てる。学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文参考訳（メタデータ） (2024-05-01T09:34:42Z)
Optimizing Solution-Samplers for Combinatorial Problems: The Landscape of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文参考訳（メタデータ） (2023-10-08T23:39:38Z)
Pareto Set Learning for Neural Multi-objective Combinatorial Optimization [6.091096843566857]
多目的最適化(MOCO)の問題は、現実世界の多くのアプリケーションで見られる。我々は,与えられたMOCO問題に対するパレート集合全体を,探索手順を伴わずに近似する学習ベースアプローチを開発した。提案手法は,多目的走行セールスマン問題,マルチコンディショニング車両ルーティング問題,複数クナップサック問題において,ソリューションの品質,速度,モデル効率の面で,他の方法よりも優れていた。
論文参考訳（メタデータ） (2022-03-29T09:26:22Z)
Scalable Uni-directional Pareto Optimality for Multi-Task Learning with Constraints [4.4044968357361745]
制約下での最適化を含む多目的(MOO)問題に対するスケーラブルなMOOソルバを提案する。この重要な応用は、ニューラル分類タスクの高次元ランタイムを推定することである。
論文参考訳（メタデータ） (2021-10-28T21:35:59Z)
Discovering Diverse Solutions in Deep Reinforcement Learning [84.45686627019408]
強化学習アルゴリズムは通常、特定のタスクの単一のソリューションを学ぶことに限定される。連続的あるいは離散的な低次元潜在変数に条件付きポリシーを訓練することにより、無限に多くの解を学習できるRL法を提案する。
論文参考訳（メタデータ） (2021-03-12T04:54:31Z)
Multi-objective Conflict-based Search for Multi-agent Path Finding [10.354181009277623]
マルチオブジェクトパスプランナーは通常、パスの長さなどの単一の目的を最適化しながら、パスのアンサンブルを計算します。本稿では、マルチオブジェクトコンフリクトベース検索(MO-CBS)という、いわゆる次元の呪いをバイパスする手法を紹介します。
論文参考訳（メタデータ） (2021-01-11T10:42:38Z)
Provable Multi-Objective Reinforcement Learning with Generative Models [98.19879408649848]
目的の選好から最適な政策を学習する単一政策 MORL の問題について検討する。既存の方法は、多目的決定プロセスの正確な知識のような強い仮定を必要とする。モデルベースエンベロップ値 (EVI) と呼ばれる新しいアルゴリズムを提案し, 包含された多目的$Q$学習アルゴリズムを一般化する。
論文参考訳（メタデータ） (2020-11-19T22:35:31Z)
Pareto Multi-Task Learning [53.90732663046125]
マルチタスク学習は複数の相関タスクを同時に解くための強力な方法である。異なるタスクが互いに衝突する可能性があるため、すべてのタスクを最適化するひとつのソリューションを見つけることは、しばしば不可能である。近年,マルチタスク学習を多目的最適化として活用することにより,タスク間のトレードオフが良好である1つのパレート最適解を求める方法が提案されている。
論文参考訳（メタデータ） (2019-12-30T08:58:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。