論文の概要: Pareto Set Learning for Neural Multi-objective Combinatorial
Optimization
- arxiv url: http://arxiv.org/abs/2203.15386v1
- Date: Tue, 29 Mar 2022 09:26:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-30 17:08:34.584500
- Title: Pareto Set Learning for Neural Multi-objective Combinatorial
Optimization
- Title(参考訳): 神経多目的組合せ最適化のためのパレート集合学習
- Authors: Xi Lin, Zhiyuan Yang, Qingfu Zhang
- Abstract要約: 多目的最適化(MOCO)の問題は、現実世界の多くのアプリケーションで見られる。
我々は,与えられたMOCO問題に対するパレート集合全体を,探索手順を伴わずに近似する学習ベースアプローチを開発した。
提案手法は,多目的走行セールスマン問題,マルチコンディショニング車両ルーティング問題,複数クナップサック問題において,ソリューションの品質,速度,モデル効率の面で,他の方法よりも優れていた。
- 参考スコア(独自算出の注目度): 6.091096843566857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiobjective combinatorial optimization (MOCO) problems can be found in
many real-world applications. However, exactly solving these problems would be
very challenging, particularly when they are NP-hard. Many handcrafted
heuristic methods have been proposed to tackle different MOCO problems over the
past decades. In this work, we generalize the idea of neural combinatorial
optimization, and develop a learning-based approach to approximate the whole
Pareto set for a given MOCO problem without further search procedure. We
propose a single preference-conditioned model to directly generate approximate
Pareto solutions for any trade-off preference, and design an efficient
multiobjective reinforcement learning algorithm to train this model. Our
proposed method can be treated as a learning-based extension for the
widely-used decomposition-based multiobjective evolutionary algorithm (MOEA/D).
It uses a single model to accommodate all the possible preferences, whereas
other methods use a finite number of solution to approximate the Pareto set.
Experimental results show that our proposed method significantly outperforms
some other methods on the multiobjective traveling salesman problem,
multiobjective vehicle routing problem and multiobjective knapsack problem in
terms of solution quality, speed, and model efficiency.
- Abstract(参考訳): 多目的組合せ最適化(MOCO)問題は多くの実世界のアプリケーションで見られる。
しかし、これらの問題を正確に解くことは、特にNPハードの場合、非常に難しい。
過去数十年にわたり、様々なMOCO問題に取り組むために、手作りのヒューリスティック手法が提案されてきた。
本研究では, ニューラル組合せ最適化の考え方を一般化し, 与えられたMOCO問題に対するパレート集合全体を, さらなる探索手順なしで近似する学習ベースアプローチを開発する。
我々は,任意のトレードオフ選好に対して近似pareto解を直接生成する単一選好条件モデルを提案し,このモデルを学習するための効率的な多目的強化学習アルゴリズムを設計する。
提案手法は、広く使われている分解型多目的進化アルゴリズム(MOEA/D)の学習ベース拡張として扱うことができる。
他の手法ではパレート集合を近似するために有限個の解を用いるのに対し、単一のモデルを使って全ての可能な選好を満たしている。
実験の結果,提案手法は,多目的走行セールスマン問題,多目的車両ルーティング問題,多目的クナップサック問題において,解の質,速度,モデル効率の点で有意な差を示した。
関連論文リスト
- Towards Efficient Pareto Set Approximation via Mixture of Experts Based Model Fusion [53.33473557562837]
大規模深層ニューラルネットワークに対する多目的最適化問題を解くことは、損失ランドスケープの複雑さと高価な計算コストのために難しい課題である。
本稿では,専門家(MoE)をベースとしたモデル融合を用いて,この問題を実用的でスケーラブルに解決する手法を提案する。
特殊な単一タスクモデルの重みをまとめることで、MoEモジュールは複数の目的間のトレードオフを効果的に捉えることができる。
論文 参考訳(メタデータ) (2024-06-14T07:16:18Z) - UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [75.11267478778295]
マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。
重みベクトル w でパラメータ化される線型効用関数の場合に焦点を当てる。
学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-05-01T09:34:42Z) - Pareto Set Learning for Expensive Multi-Objective Optimization [5.419608513284392]
膨大な多目的最適化問題は、多くの現実世界のアプリケーションで見られる。
本稿では,MOBOのパレート集合全体を近似する学習に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-10-16T09:41:54Z) - Scalable Uni-directional Pareto Optimality for Multi-Task Learning with
Constraints [4.4044968357361745]
制約下での最適化を含む多目的(MOO)問題に対するスケーラブルなMOOソルバを提案する。
この重要な応用は、ニューラル分類タスクの高次元ランタイムを推定することである。
論文 参考訳(メタデータ) (2021-10-28T21:35:59Z) - MODRL/D-EL: Multiobjective Deep Reinforcement Learning with Evolutionary
Learning for Multiobjective Optimization [10.614594804236893]
本稿では、時間窓付き多目的車両ルーティング問題と呼ばれる典型的な複雑な問題に対して、進化学習アルゴリズムを用いた多目的深部強化学習を提案する。
MO-VRPTWインスタンスの実験結果は、提案アルゴリズムが他の学習ベースおよび反復型アプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-07-16T15:22:20Z) - Provable Multi-Objective Reinforcement Learning with Generative Models [98.19879408649848]
目的の選好から最適な政策を学習する単一政策 MORL の問題について検討する。
既存の方法は、多目的決定プロセスの正確な知識のような強い仮定を必要とする。
モデルベースエンベロップ値 (EVI) と呼ばれる新しいアルゴリズムを提案し, 包含された多目的$Q$学習アルゴリズムを一般化する。
論文 参考訳(メタデータ) (2020-11-19T22:35:31Z) - Follow the bisector: a simple method for multi-objective optimization [65.83318707752385]
複数の異なる損失を最小化しなければならない最適化問題を考える。
提案手法は、各イテレーションにおける降下方向を計算し、目的関数の相対的減少を等しく保証する。
論文 参考訳(メタデータ) (2020-07-14T09:50:33Z) - GACEM: Generalized Autoregressive Cross Entropy Method for Multi-Modal
Black Box Constraint Satisfaction [69.94831587339539]
本稿では,マスク付き自己回帰ニューラルネットワークを用いて解空間上の均一分布をモデル化するクロスエントロピー法(CEM)を提案する。
我々のアルゴリズムは複雑な解空間を表現でき、様々な異なる解領域を追跡できる。
論文 参考訳(メタデータ) (2020-02-17T20:21:20Z) - MODRL/D-AM: Multiobjective Deep Reinforcement Learning Algorithm Using
Decomposition and Attention Model for Multiobjective Optimization [15.235261981563523]
本稿では,多目的最適化問題を解くための多目的深部強化学習法を提案する。
本手法では,各サブプロブレムをアテンションモデルにより解き,入力ノードの構造的特徴とノード的特徴を活用できる。
論文 参考訳(メタデータ) (2020-02-13T12:59:39Z) - Pareto Multi-Task Learning [53.90732663046125]
マルチタスク学習は複数の相関タスクを同時に解くための強力な方法である。
異なるタスクが互いに衝突する可能性があるため、すべてのタスクを最適化するひとつのソリューションを見つけることは、しばしば不可能である。
近年,マルチタスク学習を多目的最適化として活用することにより,タスク間のトレードオフが良好である1つのパレート最適解を求める方法が提案されている。
論文 参考訳(メタデータ) (2019-12-30T08:58:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。