Fugu-MT 論文翻訳(概要): RL-SPH: Learning to Achieve Feasible Solutions for Integer Linear Programs

論文の概要: RL-SPH: Learning to Achieve Feasible Solutions for Integer Linear Programs

arxiv url: http://arxiv.org/abs/2411.19517v6
Date: Mon, 02 Jun 2025 08:21:03 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-03 13:48:29.929914
Title: RL-SPH: Learning to Achieve Feasible Solutions for Integer Linear Programs
Title（参考訳）: RL-SPH:整数線形プログラムにおける実現可能な解の学習
Authors: Tae-Hoon Lee, Min-Soo Kim,
Abstract要約: RL-SPHは、非二項整数を含むILPに対しても独立に実現可能な解を生成することができる新しい強化学習ベーススタートプライマーである。実験により、RL-SPHは、既存の原始よりも平均44倍低い原始ギャップと2.3倍低い積分を達成し、高品質な実現可能な解を迅速に得ることが示された。
参考スコア（独自算出の注目度）: 3.3894236476098185
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Integer linear programming (ILP) is widely utilized for various combinatorial optimization problems. Primal heuristics play a crucial role in quickly finding feasible solutions for NP-hard ILP. Although $\textit{end-to-end learning}$-based primal heuristics (E2EPH) have recently been proposed, they are typically unable to independently generate feasible solutions and mainly focus on binary variables. Ensuring feasibility is critical, especially when handling non-binary integer variables. To address this challenge, we propose RL-SPH, a novel reinforcement learning-based start primal heuristic capable of independently generating feasible solutions, even for ILP involving non-binary integers. Experimental results demonstrate that RL-SPH rapidly obtains high-quality feasible solutions, achieving on average a 44x lower primal gap and a 2.3x lower primal integral compared to existing primal heuristics.
Abstract（参考訳）: Integer linear programming (ILP) は様々な組合せ最適化問題に広く利用されている。原始ヒューリスティックスはNP-hard ILPの実現可能な解を迅速に発見する上で重要な役割を担っている。 $\textit{end-to-end learning}$-based primal heuristics (E2EPH) は近年提案されているが、一般的には実現可能な解を独立に生成できず、主にバイナリ変数に焦点を当てる。非バイナリ整数変数を扱う場合、実現可能性を保証することが重要である。この課題に対処するために、非二項整数を含むILPに対しても、独立して実現可能な解を生成することができる新しい強化学習に基づく始始ヒューリスティックであるRL-SPHを提案する。実験により、RL-SPHは、既存の原始ヒューリスティックよりも平均44倍低い原始ギャップと2.3倍低い原始積分を達成し、高品質な実現可能な解を迅速に得ることが示された。

関連論文リスト

Learning to Refine: Self-Refinement of Parallel Reasoning in LLMs [102.48588475875749]
本稿では,新しい並列テスト時間スケーリングフレームワークであるGenerative Self-Refinement (GSR)を紹介する。 GSRは一連の候補応答を並列に生成し、その後自己精製を行い、新しい優れた解を合成する。提案手法は,5つの数学ベンチマークにおいて,最先端性能を実現する。
論文参考訳（メタデータ） (2025-08-27T06:51:48Z)
SPL-LNS: Sampling-Enhanced Large Neighborhood Search for Solving Integer Linear Programs [59.91461374628034]
大規模近傍探索(Large Neighborhood Search, LNS)は、最適化において、現在のソリューションの大きな近傍を反復的に探索し、より良い解を求めることが一般的である。本稿では,局所的最適解を逃れるために局所的インフォームド提案を利用するサンプリング型ニューラルネットワーク型LSS解法であるSPL-LNSを紹介する。
論文参考訳（メタデータ） (2025-08-22T07:49:33Z)
FMIP: Joint Continuous-Integer Flow For Mixed-Integer Linear Programming [52.52020895303244]
Mixed-Integer Linear Programming (MILP)は、複雑な意思決定問題の基本的なツールである。混合整数線形計画法(FMIP)のための連立連続整数フローを提案する。これはMILPソリューションにおける整数変数と連続変数の共分散をモデル化する最初の生成フレームワークである。 FMIPは任意のバックボーンネットワークや様々なダウンストリームソルバと完全に互換性があり、現実世界のMILPアプリケーションにも適している。
論文参考訳（メタデータ） (2025-07-31T10:03:30Z)
Apollo-MILP: An Alternating Prediction-Correction Neural Solving Framework for Mixed-Integer Linear Programming [57.24050601521162]
Apollo-MILP (Alternating Prediction-correction Neural solve framework) を提案する。各イテレーションにおいて、Apollo-MILPは未固定変数の予測ステップを実行し、その後修正ステップを行い、信頼領域探索を通じて改善された解(参照解と呼ばれる)を得る。一般的なベンチマーク実験により,提案したApollo-MILPは,ソリューションの品質の観点から,他のMLベースのアプローチよりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2025-03-03T03:19:49Z)
Towards graph neural networks for provably solving convex optimization problems [5.966097889241178]
提案するMPNNフレームワークは,検証可能な実現可能性保証を用いて凸最適化問題を解決する。実験の結果,提案手法は既存の神経ベースラインよりも解の質や実現可能性に優れていた。
論文参考訳（メタデータ） (2025-02-04T16:11:41Z)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.469394148261838]
混合整数非線形プログラム(MINLP)は、エネルギーシステムや輸送といった様々な領域で発生する。 MINLPは特に大規模な解決が難しいことで知られている。本稿では,解の積分性を保証するための2つの学習可能な補正層と,解の実現性を改善するための後処理ステップを備えた新しいディープラーニング手法を提案する。
論文参考訳（メタデータ） (2024-10-14T20:14:39Z)
Learning Constrained Optimization with Deep Augmented Lagrangian Methods [54.22290715244502]
機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文参考訳（メタデータ） (2024-03-06T04:43:22Z)
Continuous Tensor Relaxation for Finding Diverse Solutions in Combinatorial Optimization Problems [0.6906005491572401]
本研究では、教師なし学習(UL)に基づくCOソルバのための連続的アン緩和(CTRA)を提案する。 CTRAは、単一のトレーニング実行で多様なソリューションを見つけるための計算効率のよいフレームワークである。数値実験により、CTRAにより、ULベースの解法は、既存の解法を繰り返すよりもはるかに高速にこれらの多様な解を見つけることができることが示された。
論文参考訳（メタデータ） (2024-02-03T15:31:05Z)
Machine Learning Insides OptVerse AI Solver: Design Principles and Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文参考訳（メタデータ） (2024-01-11T15:02:15Z)
An Expandable Machine Learning-Optimization Framework to Sequential Decision-Making [0.0]
逐次的意思決定問題を効率的に解決する統合予測最適化(PredOpt)フレームワークを提案する。本稿では,機械学習(ML)における逐次依存,実現可能性,一般化といった課題に対処し,インスタンス問題に対する最適解の予測を行う。
論文参考訳（メタデータ） (2023-11-12T21:54:53Z)
A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。 MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文参考訳（メタデータ） (2023-09-02T11:01:16Z)
Learning To Dive In Branch And Bound [95.13209326119153]
グラフニューラルネットワークを用いて特定の潜水構造を学習するためのL2Diveを提案する。我々は、変数の割り当てを予測するために生成モデルを訓練し、線形プログラムの双対性を利用して潜水決定を行う。
論文参考訳（メタデータ） (2023-01-24T12:01:45Z)
A Survey on Influence Maximization: From an ML-Based Combinatorial Optimization [2.9882027965916413]
影響最大化(IM)は、モバイルネットワーク、ソーシャルコンピューティング、レコメンデーションシステムで広く用いられる古典的な最適化問題である。主な課題は、IM問題のNP硬度と、影響力の広がりを推定する#P硬度である。我々は,関連する背景知識,基本原則,共通手法,応用研究の要約に重点を置いている。
論文参考訳（メタデータ） (2022-11-06T10:13:42Z)
DIMES: A Differentiable Meta Solver for Combinatorial Optimization Problems [41.57773395100222]
深部強化学習(DRL)モデルはNP-hard Combinatorial Optimization問題を解決する上で有望な結果を示している。本稿では,DIMESという新しいアプローチを提案することによって,大規模最適化におけるスケーラビリティの課題に対処する。コストのかかる自己回帰的復号法や離散解の反復的洗練に苦しむ従来のDRL法とは異なり、DIMESは候補解の基底分布をパラメータ化するためのコンパクトな連続空間を導入する。 DIMESは、トラベリングセールスマン問題や最大独立セット問題のための大規模なベンチマークデータセットにおいて、最近のDRLベースの手法よりも優れていることを示す。
論文参考訳（メタデータ） (2022-10-08T23:24:37Z)
MIP-GNN: A Data-Driven Framework for Guiding Combinatorial Solvers [13.790116387956703]
混合整数プログラミング(MIP)技術は最適化問題の定式化と解法を提供する。 MIP-GNNは、データ駆動の洞察でそのような問題を解決するための一般的なフレームワークである。 MIP-GNNを最先端のMIP解決器に統合し,ノード選択やウォームスタートといったタスクに適用する。
論文参考訳（メタデータ） (2022-05-27T19:34:14Z)
Neur2SP: Neural Two-Stage Stochastic Programming [3.5417030119735045]
我々はニューラルネットワークを介して期待値関数を近似する新しい方法Neur2SPを開発した。 Neur2SPはすべての問題に対して1.66秒未満で、シナリオの数が増えても高品質なソリューションを実現する。
論文参考訳（メタデータ） (2022-05-20T22:09:22Z)
Improved Training of Physics-Informed Neural Networks with Model Ensembles [81.38804205212425]
我々は、PINNを正しい解に収束させるため、解区間を徐々に拡大することを提案する。すべてのアンサンブルのメンバーは、観測されたデータの近くで同じ解に収束する。提案手法は, 得られた解の精度を向上させることができることを示す。
論文参考訳（メタデータ） (2022-04-11T14:05:34Z)
Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文参考訳（メタデータ） (2022-01-28T05:53:28Z)
Learning Primal Heuristics for Mixed Integer Programs [5.766851255770718]
本研究は,機械学習を用いて効果的な霊長類を自動学習できるかどうかを考察する。本稿では,最適化問題をグラフとして表現するための新しい手法を提案する。可変解の予測はB&B法の新たな構成であるProbabilistic Branching with guided Depth-first Searchによって行われる。
論文参考訳（メタデータ） (2021-07-02T06:46:23Z)
A Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering [60.768146126094955]
弱々しい教師付き質問応答は通常、最終的な答えのみを監督信号として持つ。偶然に正解を導出する刺激的な解が多数存在するかもしれないが、そのような解の訓練はモデルの性能を損なう可能性がある。本稿では,質問応答対と予測解間の相互情報の最大化により,このような意味的相関を明示的に活用することを提案する。
論文参考訳（メタデータ） (2021-06-14T05:47:41Z)
Agnostic Proper Learning of Halfspaces under Gaussian Marginals [56.01192577666607]
ガウスの下の半空間を不可知的に学習する問題を考察する。我々の主な成果は、この問題に対するエム第一固有学習アルゴリズムである。
論文参考訳（メタデータ） (2021-02-10T18:40:44Z)
Learning by Fixing: Solving Math Word Problems with Weak Supervision [70.62896781438694]
数学用語問題(mwps)の従来のニューラルネットワークソルバは、完全な監視によって学習され、多様なソリューションを生み出すことができない。 MWPを学習するためのテキスト弱教師付きパラダイムを提案する。この手法は最終回答のアノテーションのみを必要とし、単一の問題に対して様々な解決策を生成できる。
論文参考訳（メタデータ） (2020-12-19T03:10:21Z)
Combining Deep Learning and Optimization for Security-Constrained Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。 SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-14T12:38:21Z)
An Online Method for A Class of Distributionally Robust Optimization with Non-Convex Objectives [54.29001037565384]
本稿では,オンライン分散ロバスト最適化(DRO)のクラスを解決するための実用的なオンライン手法を提案する。本研究は,ネットワークの堅牢性向上のための機械学習における重要な応用を実証する。
論文参考訳（メタデータ） (2020-06-17T20:19:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。