論文の概要: Efficient Meta Neural Heuristic for Multi-Objective Combinatorial
Optimization
- arxiv url: http://arxiv.org/abs/2310.15196v1
- Date: Sun, 22 Oct 2023 08:59:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 22:45:26.902311
- Title: Efficient Meta Neural Heuristic for Multi-Objective Combinatorial
Optimization
- Title(参考訳): 多目的組合せ最適化のための効率的なメタニューラルヒューリスティック
- Authors: Jinbiao Chen, Jiahai Wang, Zizhen Zhang, Zhiguang Cao, Te Ye, Siyuan
Chen
- Abstract要約: 本稿では,多目的最適化問題を解くために,効率的なメタニューラルベクトル(EMNH)を提案する。
EMNHは、ソリューションの品質と学習効率の点で最先端のニューラルネットワークより優れている。
- 参考スコア(独自算出の注目度): 35.09656455088854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, neural heuristics based on deep reinforcement learning have
exhibited promise in solving multi-objective combinatorial optimization
problems (MOCOPs). However, they are still struggling to achieve high learning
efficiency and solution quality. To tackle this issue, we propose an efficient
meta neural heuristic (EMNH), in which a meta-model is first trained and then
fine-tuned with a few steps to solve corresponding single-objective
subproblems. Specifically, for the training process, a (partial)
architecture-shared multi-task model is leveraged to achieve parallel learning
for the meta-model, so as to speed up the training; meanwhile, a scaled
symmetric sampling method with respect to the weight vectors is designed to
stabilize the training. For the fine-tuning process, an efficient hierarchical
method is proposed to systematically tackle all the subproblems. Experimental
results on the multi-objective traveling salesman problem (MOTSP),
multi-objective capacitated vehicle routing problem (MOCVRP), and
multi-objective knapsack problem (MOKP) show that, EMNH is able to outperform
the state-of-the-art neural heuristics in terms of solution quality and
learning efficiency, and yield competitive solutions to the strong traditional
heuristics while consuming much shorter time.
- Abstract(参考訳): 近年,深層強化学習に基づくニューラルヒューリスティックスは,多目的組合せ最適化問題(mocops)の解決に有望である。
しかし、彼らは依然として高い学習効率とソリューションの品質を達成するのに苦労している。
この問題に対処するために,まずメタモデルを訓練し,次にいくつかのステップで微調整し,対応する単目的サブプロブレムを解く,効率的なメタニューラルヒューリスティック(EMNH)を提案する。
具体的には、(部分的な)アーキテクチャ共有マルチタスクモデルを利用してメタモデルの並列学習を行い、トレーニングを高速化する一方、重みベクトルに関するスケールド対称サンプリング法はトレーニングを安定化させるように設計されている。
微調整プロセスでは,全ての部分問題に体系的に取り組むための効率的な階層的手法が提案されている。
multi-objective travel salesman problem (motsp)、multi-objective capacitated vehicle routing problem (mocvrp)、multi-objective knapsack problem (mokp)の実験結果は、emnhが解の質と学習効率の点で最先端のニューラルヒューリスティックよりも優れており、強力な伝統的なヒューリスティックに競争力のある解決策を与えながら、はるかに短い時間を消費できることを示している。
関連論文リスト
- Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.86576388991713]
正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文 参考訳(メタデータ) (2024-10-29T14:41:44Z) - Towards Efficient Pareto Set Approximation via Mixture of Experts Based Model Fusion [53.33473557562837]
大規模深層ニューラルネットワークに対する多目的最適化問題を解くことは、損失ランドスケープの複雑さと高価な計算コストのために難しい課題である。
本稿では,専門家(MoE)をベースとしたモデル融合を用いて,この問題を実用的でスケーラブルに解決する手法を提案する。
特殊な単一タスクモデルの重みをまとめることで、MoEモジュールは複数の目的間のトレードオフを効果的に捉えることができる。
論文 参考訳(メタデータ) (2024-06-14T07:16:18Z) - UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [75.11267478778295]
マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。
重みベクトル w でパラメータ化される線型効用関数の場合に焦点を当てる。
学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-05-01T09:34:42Z) - Non-orthogonal Age-Optimal Information Dissemination in Vehicular
Networks: A Meta Multi-Objective Reinforcement Learning Approach [0.0]
道路側ユニット(RSU)は、車両に物理プロセスのセットに関するタイムリーな更新を提供する。
定式化問題は多目的混合整数非線形計画問題である。
我々は,各最適化サブプロブレムを解くために,DQN-Deep Deterministic Policy gradient (DDPG)モデルを開発した。
論文 参考訳(メタデータ) (2024-02-15T16:51:47Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Multi-Objective Optimization for Sparse Deep Multi-Task Learning [0.0]
重み付きチェビシェフスキャラライゼーションを用いたディープニューラルネットワーク(DNN)のトレーニングのための多目的最適化アルゴリズムを提案する。
本研究の目的は,DNNモデルの持続可能性問題,特にDeep Multi-Taskモデルに焦点をあてることである。
論文 参考訳(メタデータ) (2023-08-23T16:42:27Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Pareto Set Learning for Neural Multi-objective Combinatorial
Optimization [6.091096843566857]
多目的最適化(MOCO)の問題は、現実世界の多くのアプリケーションで見られる。
我々は,与えられたMOCO問題に対するパレート集合全体を,探索手順を伴わずに近似する学習ベースアプローチを開発した。
提案手法は,多目的走行セールスマン問題,マルチコンディショニング車両ルーティング問題,複数クナップサック問題において,ソリューションの品質,速度,モデル効率の面で,他の方法よりも優れていた。
論文 参考訳(メタデータ) (2022-03-29T09:26:22Z) - MODRL/D-EL: Multiobjective Deep Reinforcement Learning with Evolutionary
Learning for Multiobjective Optimization [10.614594804236893]
本稿では、時間窓付き多目的車両ルーティング問題と呼ばれる典型的な複雑な問題に対して、進化学習アルゴリズムを用いた多目的深部強化学習を提案する。
MO-VRPTWインスタンスの実験結果は、提案アルゴリズムが他の学習ベースおよび反復型アプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-07-16T15:22:20Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Meta-Learning-based Deep Reinforcement Learning for Multiobjective
Optimization Problems [11.478548460936837]
本稿では,簡潔なメタラーニングに基づくDRLアプローチを提案する。
最初にメタモデルをメタラーニングで訓練する。
メタモデルは、対応するサブ問題に対するサブモデルを導出するためのいくつかの更新ステップで微調整される。
論文 参考訳(メタデータ) (2021-05-06T15:09:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。