論文の概要: Pointer Networks with Q-Learning for OP Combinatorial Optimization
- arxiv url: http://arxiv.org/abs/2311.02629v1
- Date: Sun, 5 Nov 2023 12:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 16:42:07.425773
- Title: Pointer Networks with Q-Learning for OP Combinatorial Optimization
- Title(参考訳): OP Combinatorial OptimizationのためのQ-Learning付きポインタネットワーク
- Authors: Alessandro Barro
- Abstract要約: オブジェクト指向問題(OP)は最適化においてユニークな課題を提示します。
OPのNPハードの性質を考えると、最適解を得るのは本質的に複雑である。
この研究はPointer Q-Network (PQN)を発表した。
- 参考スコア(独自算出の注目度): 65.268245109828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Orienteering Problem (OP) presents a unique challenge in combinatorial
optimization, emphasized by its widespread use in logistics, delivery, and
transportation planning. Given the NP-hard nature of OP, obtaining optimal
solutions is inherently complex. While Pointer Networks (Ptr-Nets) have
exhibited prowess in various combinatorial tasks, their performance in the
context of OP leaves room for improvement. Recognizing the potency of
Q-learning, especially when paired with deep neural structures, this research
unveils the Pointer Q-Network (PQN). This innovative method combines Ptr-Nets
and Q-learning, effectively addressing the specific challenges presented by OP.
We deeply explore the architecture and efficiency of PQN, showcasing its
superior capability in managing OP situations.
- Abstract(参考訳): オリエンテーリング問題(OP)は、ロジスティクス、配送、輸送計画において広く使われていることを強調する組合せ最適化において、ユニークな課題を提示している。
OPのNPハードの性質を考えると、最適解を得るのは本質的に複雑である。
Pointer Networks (Ptr-Nets) は様々な組合せタスクに長けているが、OPの文脈でのパフォーマンスは改善の余地を残している。
この研究は、特に深層神経構造と組み合わせた場合、Q-ラーニングの有用性を認識し、Pointer Q-Network(PQN)を公表する。
この革新的な手法は、Ptr-NetsとQ-learningを組み合わせて、OPが提示する特定の課題に効果的に対処する。
PQNのアーキテクチャと効率を深く探求し、OP状況を管理する上で優れた能力を示している。
関連論文リスト
- An Efficient Learning-based Solver Comparable to Metaheuristics for the
Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。
まず,方向対応型注意モデル(DaAM)を提案する。
第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文 参考訳(メタデータ) (2024-03-11T02:17:42Z) - Quantum Annealing and Graph Neural Networks for Solving TSP with QUBO [0.0]
本稿では、量子アニーリングアルゴリズムとグラフニューラルネットワークによるトラベリングセールスマン問題(TSP)の解法として、二次非拘束バイナリ最適化(QUBO)モデルの適用について検討する。
TSP(QGNN-TSP)のためのグラフニューラルネットワークソリューションを導入し、問題の基盤構造を学習し、QUBOに基づく損失関数の勾配降下による競合ソリューションを生成する。
論文 参考訳(メタデータ) (2024-02-21T05:55:00Z) - Multi-Timescale Ensemble Q-learning for Markov Decision Process Policy
Optimization [21.30645601474163]
元々のQ-ラーニングは、非常に大きなネットワークにわたるパフォーマンスと複雑性の課題に悩まされている。
従来のQ-ラーニングに適応したモデルフリーアンサンブル強化学習アルゴリズムを提案する。
計算結果から,提案アルゴリズムは平均ポリシエラーを最大55%,実行時複雑性を最大50%削減できることがわかった。
論文 参考訳(メタデータ) (2024-02-08T08:08:23Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Multi Agent DeepRL based Joint Power and Subchannel Allocation in IAB
networks [0.0]
統合アクセスとバックハウリング(IRL)は、将来の世代におけるより高いデータレートに対する前例のない要求を満たすための、実行可能なアプローチである。
本稿では,分数ノードに付随する巨大なアクション空間の問題を,Deep Q-Learning Networkを用いて処理する方法を示す。
論文 参考訳(メタデータ) (2023-08-31T21:30:25Z) - Optimizing Tensor Network Contraction Using Reinforcement Learning [86.05566365115729]
本稿では,グラフニューラルネットワーク(GNN)と組み合わせた強化学習(RL)手法を提案する。
この問題は、巨大な検索スペース、重い尾の報酬分布、そして困難なクレジット割り当てのために非常に難しい。
GNNを基本方針として利用するRLエージェントが,これらの課題にどのように対処できるかを示す。
論文 参考訳(メタデータ) (2022-04-18T21:45:13Z) - Feature Importance-aware Graph Attention Network and Dueling Double Deep
Q-Network Combined Approach for Critical Node Detection Problems [61.48763653120301]
クリティカルノード問題(Critical Node Problem, CNP)は、ネットワークから重要なノードの集合を見つけることを目的とした問題である。
本研究は,ノード表現のための特徴重要度対応グラフアテンションネットワークを提案する。
ダブルディープQネットワークと組み合わせて、初めてCNPを解くエンドツーエンドのアルゴリズムを作成する。
論文 参考訳(メタデータ) (2021-12-03T14:23:05Z) - Deep Learning Methods for Joint Optimization of Beamforming and
Fronthaul Quantization in Cloud Radio Access Networks [12.838832724944615]
クラウド無線ネットワーク(C-RAN)システムでは,AP間の協調ビームフォーミングとフロントハウライズ戦略が不可欠である。
非次元量問題は、AP当たりの電力とフロントホール容量の制約から導かれる。
我々は、よく訓練された深層ニューラルネットワーク(DNN)が存在する深層学習最適化モジュールについて検討する。
提案手法の利点を数値計算により検証した。
論文 参考訳(メタデータ) (2021-07-06T10:27:43Z) - Adaptive Contention Window Design using Deep Q-learning [46.49295424938727]
ランダムアクセス無線ネットワークにおける適応競合窓(CW)設計の問題について検討する。
我々のゴールは、ネットワークレベルのユーティリティを最大化するために、最小CW(MCW)パラメータを動的に適応できるインテリジェントノードを設計することである。
論文 参考訳(メタデータ) (2020-11-18T17:31:18Z) - Deep Multi-Task Learning for Cooperative NOMA: System Design and
Principles [52.79089414630366]
我々は,近年のディープラーニング(DL)の進歩を反映した,新しいディープ・コラボレーティブなNOMAスキームを開発する。
我々は,システム全体を包括的に最適化できるように,新しいハイブリッドカスケードディープニューラルネットワーク(DNN)アーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-07-27T12:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。