論文の概要: Regularized Langevin Dynamics for Combinatorial Optimization
- arxiv url: http://arxiv.org/abs/2502.00277v2
- Date: Tue, 10 Jun 2025 07:54:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:39.456181
- Title: Regularized Langevin Dynamics for Combinatorial Optimization
- Title(参考訳): 組合せ最適化のための正規化ランゲヴィンダイナミクス
- Authors: Shengyu Feng, Yiming Yang,
- Abstract要約: 正規化ランゲヴィンダイナミクス(英: Regularized Langevin Dynamics、RLD)は、効率的な勾配誘導型生成パラダイムである。
RLDはサンプリングされた溶液と現在の溶液の間に期待される距離を強制し、局所的なミニマを効果的に避ける。
シミュレーションアニーリング(SA)とニューラルネットワーク(NN)に基づく2つのCOソルバを開発した。
- 参考スコア(独自算出の注目度): 33.90726769113883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work proposes a simple yet effective sampling framework for combinatorial optimization (CO). Our method builds on discrete Langevin dynamics (LD), an efficient gradient-guided generative paradigm. However, we observe that directly applying LD often leads to limited exploration. To overcome this limitation, we propose the Regularized Langevin Dynamics (RLD), which enforces an expected distance between the sampled and current solutions, effectively avoiding local minima. We develop two CO solvers on top of RLD, one based on simulated annealing (SA), and the other one based on neural network (NN). Empirical results on three classic CO problems demonstrate that both of our methods can achieve comparable or better performance against the previous state-of-the-art (SOTA) SA- and NN-based solvers. In particular, our SA algorithm reduces the runtime of the previous SOTA SA method by up to 80\%, while achieving equal or superior performance. In summary, RLD offers a promising framework for enhancing both traditional heuristics and NN models to solve CO problems. Our code is available at https://github.com/Shengyu-Feng/RLD4CO.
- Abstract(参考訳): 本研究は,組合せ最適化(CO)のための簡易かつ効果的なサンプリングフレームワークを提案する。
本手法は,効率的な勾配誘導生成パラダイムである離散ランゲヴィンダイナミクス(LD)に基づく。
しかし、直接LDを適用すると、探索が制限されることが多い。
この制限を克服するために、サンプルと現在の解の間に期待される距離を強制し、局所最小化を効果的に回避する正規化ランゲヴィンダイナミクス(RLD)を提案する。
シミュレーションアニーリング(SA)とニューラルネットワーク(NN)に基づく2つのCOソルバを開発した。
従来のSOTA (State-of-the-art) SA-およびNN-based solverに対して,2つの手法が同等あるいはより良い性能を達成できることが実証された。
特に、我々のSAアルゴリズムは、同等または優れた性能を達成しつつ、以前のSOTA SA法のランタイムを最大80%削減する。
まとめると、RDDはCO問題を解決するために従来のヒューリスティックとNNモデルの両方を強化する、有望なフレームワークを提供する。
私たちのコードはhttps://github.com/Shengyu-Feng/RLD4COで公開されています。
関連論文リスト
- L2R: Learning to Reduce Search Space for Generalizable Neural Routing Solver [12.396576646539252]
構成的ニューラル最適化(NCO)は、手作りのルールに頼ることなく複雑なルーティング問題を解決する能力によって、研究の注目を集めている。
既存のNCO手法は、計算の複雑さと構造パターンの非効率な捕捉により、大規模問題に一般化する際の課題に直面している。
建設的NCOプロセスの各ステップにおいて,少数の有望な候補ノードを適応的に選択する,学習に基づく探索空間削減手法を提案する。
論文 参考訳(メタデータ) (2025-03-05T03:25:09Z) - Non-Reversible Langevin Algorithms for Constrained Sampling [13.472207533177151]
本研究では,制約領域上の対象分布から標本化することを目的とする制約サンプリング問題を考察する。
SRNLD(skew-reflected non-reversible Langevin dynamics)を提案する。
我々は,SRNLDの非漸近収束速度を,全変量と1-ワッサーシュタイン距離の両方の目標分布に求める。
論文 参考訳(メタデータ) (2025-01-20T21:04:29Z) - Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.083337333478674]
本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。
WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文 参考訳(メタデータ) (2024-07-18T02:46:06Z) - Instance-Conditioned Adaptation for Large-scale Generalization of Neural Combinatorial Optimization [15.842155380912002]
本研究は,ニューラル最適化の大規模一般化のための新しいインスタンス・コンディション適応モデル(ICAM)を提案する。
特に,NCOモデルのための強力なインスタンス条件付きルーティング適応モジュールを設計する。
我々は,ラベル付き最適解を使わずに,モデルがクロススケールな特徴を学習することのできる,効率的な3段階強化学習ベーストレーニング手法を開発した。
論文 参考訳(メタデータ) (2024-05-03T08:00:19Z) - An Efficient Learning-based Solver Comparable to Metaheuristics for the
Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。
まず,方向対応型注意モデル(DaAM)を提案する。
第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文 参考訳(メタデータ) (2024-03-11T02:17:42Z) - Multi-Objective Reinforcement Learning-based Approach for Pressurized Water Reactor Optimization [0.0]
PEARLは、従来のポリシーに基づく多目的強化学習法とを、単一のポリシーを学習することで区別する。
ディープラーニングと進化的テクニックにインスパイアされたいくつかのバージョンが作成され、制約のない問題ドメインと制約のない問題ドメインの両方に対応している。
2つの実用的PWRコアローディングパターン最適化問題を用いて実世界の応用性を実証した。
論文 参考訳(メタデータ) (2023-12-15T20:41:09Z) - An Optimization-based Deep Equilibrium Model for Hyperspectral Image
Deconvolution with Convergence Guarantees [71.57324258813675]
本稿では,ハイパースペクトル画像のデコンボリューション問題に対処する新しい手法を提案する。
新しい最適化問題を定式化し、学習可能な正規化器をニューラルネットワークの形で活用する。
導出した反復解法は、Deep Equilibriumフレームワーク内の不動点計算問題として表現される。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Score-Guided Intermediate Layer Optimization: Fast Langevin Mixing for
Inverse Problem [97.64313409741614]
ランダム重み付きDNNジェネレータを反転させるため,Langevinアルゴリズムの定常分布を高速に混合し,特徴付ける。
本稿では,事前学習した生成モデルの潜時空間における後部サンプリングを提案する。
論文 参考訳(メタデータ) (2022-06-18T03:47:37Z) - Verification of Neural-Network Control Systems by Integrating Taylor
Models and Zonotopes [0.0]
ニューラルネットワークコントローラ(NNCS)を用いた閉ループ力学系の検証問題について検討する。
本稿では,Taylorモデルとzonotopesに基づくアプローチをチェーンするアルゴリズムを提案し,NNCSの精度の高い到達性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-16T20:46:39Z) - Towards Understanding Label Smoothing [36.54164997035046]
ラベルスムーズな正規化(LSR)は、トレーニングアルゴリズムによるディープニューラルネットワークにおいて大きな成功を収めている。
適切なLSRが分散を減少させることで収束を加速することを示す。
本稿では,TSLA(Two-Stage LAbel smoothing algorithm)を提案する。
論文 参考訳(メタデータ) (2020-06-20T20:36:17Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。