論文の概要: RELS-DQN: A Robust and Efficient Local Search Framework for
Combinatorial Optimization
- arxiv url: http://arxiv.org/abs/2304.06048v1
- Date: Tue, 11 Apr 2023 18:01:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-14 16:46:16.637294
- Title: RELS-DQN: A Robust and Efficient Local Search Framework for
Combinatorial Optimization
- Title(参考訳): RELS-DQN: 組合せ最適化のためのロバストで効率的なローカル検索フレームワーク
- Authors: Yuanhang Shao, Tonmoy Dey, Nikola Vuckovic, Luke Van Popering, Alan
Kuhnle
- Abstract要約: 本稿では,DQNフレームワークのRELS-DQNを紹介する。
1つのアプリケーションでトレーニングされたRELS-DQNモデルを使用することで、ローカル検索アルゴリズムと既存のDQNモデルの両方に等しい解値を提供することで、様々なアプリケーションに一般化することができる。
- 参考スコア(独自算出の注目度): 11.269582666887324
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Combinatorial optimization (CO) aims to efficiently find the best solution to
NP-hard problems ranging from statistical physics to social media marketing. A
wide range of CO applications can benefit from local search methods because
they allow reversible action over greedy policies. Deep Q-learning (DQN) using
message-passing neural networks (MPNN) has shown promise in replicating the
local search behavior and obtaining comparable results to the local search
algorithms. However, the over-smoothing and the information loss during the
iterations of message passing limit its robustness across applications, and the
large message vectors result in memory inefficiency. Our paper introduces
RELS-DQN, a lightweight DQN framework that exhibits the local search behavior
while providing practical scalability. Using the RELS-DQN model trained on one
application, it can generalize to various applications by providing solution
values higher than or equal to both the local search algorithms and the
existing DQN models while remaining efficient in runtime and memory.
- Abstract(参考訳): Combinatorial Optimization(CO)は、統計物理学からソーシャルメディアマーケティングまで、NPハード問題に対する最良の解決策を効率的に見つけることを目的としている。
広い範囲のCOアプリケーションは、強欲なポリシーに対する可逆的な行動を可能にするため、局所的な検索手法の恩恵を受けることができる。
メッセージパッシングニューラルネットワーク(MPNN)を用いた深層Q-learning(DQN)は、局所的な検索行動を複製し、局所的な検索アルゴリズムに匹敵する結果を得るという約束を示す。
しかし、メッセージパッシングの繰り返しにおける過度な平滑化と情報損失は、アプリケーション間の堅牢性を制限し、大きなメッセージベクトルはメモリの効率を損なう。
本稿では,実用的なスケーラビリティを提供しながら,局所的な検索動作を示す軽量なdqnフレームワークであるrels-dqnについて紹介する。
1つのアプリケーションでトレーニングされたRELS-DQNモデルを使用することで、ローカル検索アルゴリズムと既存のDQNモデルの両方と同等以上のソリューション値を提供しながら、実行時およびメモリ上で効率を保ちながら、様々なアプリケーションに一般化することができる。
関連論文リスト
- MARCO: A Memory-Augmented Reinforcement Framework for Combinatorial Optimization [44.24494442399324]
本稿では,MARCO(Memory-Augmented Reinforcement for Combinatorial Optimization)と呼ばれる多機能フレームワークを紹介する。
MARCOは最適化軌道全体を通して収集されたデータを格納し、各状態におけるコンテキスト関連情報を検索する。
NCOモデルの並列性により、複数の検索スレッドが同時に動作し、すべて同じメモリモジュールを共有することができる。
論文 参考訳(メタデータ) (2024-08-05T03:15:21Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Quality-Diversity Algorithms Can Provably Be Helpful for Optimization [24.694984679399315]
QD(Quality-Diversity)アルゴリズムは、ハイパフォーマンスだが多様なソリューションのセットを見つけることを目的としている。
本稿では,厳密な実行時間解析によってQDアルゴリズムの最適化能力に光を当てようとしている。
論文 参考訳(メタデータ) (2024-01-19T07:40:24Z) - Learning to Control Local Search for Combinatorial Optimization [4.243592852049962]
一般化の動物園と問題固有の局所探索の変種は、近似解を計算するのによく用いられる。
本稿では,そのような局所探索アルゴリズムの3つの独立したアルゴリズム的側面を同定し,最適化プロセス上でのシーケンシャルな選択を形式化する。
我々は、NeuroLSがオペレーティングリサーチの汎用ローカルサーチコントローラと最新の機械学習ベースのアプローチの両方より優れていることを示す。
論文 参考訳(メタデータ) (2022-06-27T10:48:56Z) - Deterministic Iteratively Built KD-Tree with KNN Search for Exact
Applications [2.7325238096808318]
K-Nearest Neighbors (KNN)サーチは、ロボット工学や自動運転車に応用された人工知能ソフトウェアの基本アルゴリズムである。
二分木と同様に、kd-treesはオンラインアプリケーションに新しいデータが付加され、木が再構築されない限り、検索性能が急速に低下する可能性があるため、不均衡になる。
クエリ結果の正確さを損なうことなく、ツリー再構築の回数を減らす「インターバルkd-treesのフォレスト」を提示する。
論文 参考訳(メタデータ) (2021-06-07T17:09:22Z) - Combined Depth Space based Architecture Search For Person
Re-identification [70.86236888223569]
個人再識別(ReID)のための軽量で適切なネットワークの設計を目指しています。
本研究では,CDNetと呼ばれる効率的なネットワークアーキテクチャの探索に基づく,複合深さ空間(Componed Depth Space, CDS)と呼ばれる新しい検索空間を提案する。
そこで我々はTop-k Sample Search戦略という低コストの検索戦略を提案し、検索空間をフル活用し、局所的な最適結果のトラップを避ける。
論文 参考訳(メタデータ) (2021-04-09T02:40:01Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - ISTA-NAS: Efficient and Consistent Neural Architecture Search by Sparse
Coding [86.40042104698792]
スパース符号問題としてニューラルアーキテクチャ探索を定式化する。
実験では、CIFAR-10の2段階法では、検索にわずか0.05GPUしか必要としない。
本手法は,CIFAR-10とImageNetの両方において,評価時間のみのコストで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-10-13T04:34:24Z) - CATCH: Context-based Meta Reinforcement Learning for Transferrable
Architecture Search [102.67142711824748]
CATCHは、転送可能なarChitecture searcHのための、Context-bAsed meTa強化学習アルゴリズムである。
メタラーニングとRLの組み合わせにより、CATCHは検索空間に依存しないまま、新しいタスクに効率的に適応できる。
また、ImageNet、COCO、Cityscapesの競合ネットワークとしてクロスドメインアーキテクチャサーチを扱うこともできる。
論文 参考訳(メタデータ) (2020-07-18T09:35:53Z) - Off-Policy Reinforcement Learning for Efficient and Effective GAN
Architecture Search [50.40004966087121]
本稿では,GANアーキテクチャ探索のための強化学習に基づくニューラルアーキテクチャ探索手法を提案する。
鍵となる考え方は、よりスムーズなアーキテクチャサンプリングのためのマルコフ決定プロセス(MDP)として、GANアーキテクチャ探索問題を定式化することである。
我々は,従来の政策によって生成されたサンプルを効率的に活用する,非政治的なGANアーキテクチャ探索アルゴリズムを利用する。
論文 参考訳(メタデータ) (2020-07-17T18:29:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。