論文の概要: Pointer Networks with Q-Learning for OP Combinatorial Optimization
- arxiv url: http://arxiv.org/abs/2311.02629v1
- Date: Sun, 5 Nov 2023 12:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 16:42:07.425773
- Title: Pointer Networks with Q-Learning for OP Combinatorial Optimization
- Title(参考訳): OP Combinatorial OptimizationのためのQ-Learning付きポインタネットワーク
- Authors: Alessandro Barro
- Abstract要約: オブジェクト指向問題(OP)は最適化においてユニークな課題を提示します。
OPのNPハードの性質を考えると、最適解を得るのは本質的に複雑である。
この研究はPointer Q-Network (PQN)を発表した。
- 参考スコア(独自算出の注目度): 65.268245109828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Orienteering Problem (OP) presents a unique challenge in combinatorial
optimization, emphasized by its widespread use in logistics, delivery, and
transportation planning. Given the NP-hard nature of OP, obtaining optimal
solutions is inherently complex. While Pointer Networks (Ptr-Nets) have
exhibited prowess in various combinatorial tasks, their performance in the
context of OP leaves room for improvement. Recognizing the potency of
Q-learning, especially when paired with deep neural structures, this research
unveils the Pointer Q-Network (PQN). This innovative method combines Ptr-Nets
and Q-learning, effectively addressing the specific challenges presented by OP.
We deeply explore the architecture and efficiency of PQN, showcasing its
superior capability in managing OP situations.
- Abstract(参考訳): オリエンテーリング問題(OP)は、ロジスティクス、配送、輸送計画において広く使われていることを強調する組合せ最適化において、ユニークな課題を提示している。
OPのNPハードの性質を考えると、最適解を得るのは本質的に複雑である。
Pointer Networks (Ptr-Nets) は様々な組合せタスクに長けているが、OPの文脈でのパフォーマンスは改善の余地を残している。
この研究は、特に深層神経構造と組み合わせた場合、Q-ラーニングの有用性を認識し、Pointer Q-Network(PQN)を公表する。
この革新的な手法は、Ptr-NetsとQ-learningを組み合わせて、OPが提示する特定の課題に効果的に対処する。
PQNのアーキテクチャと効率を深く探求し、OP状況を管理する上で優れた能力を示している。
関連論文リスト
- Enhancing Variational Quantum Circuit Training: An Improved Neural Network Approach for Barren Plateau Mitigation [0.0]
変分量子アルゴリズム(VQA)は、短期量子コンピューティングにおいて最も有望なアルゴリズムの一つである。
コスト関数を最適化するために回路パラメータを反復的に更新する。
変分量子回路(VQCs)の訓練は、バレンプラトー(BPs)と呼ばれる現象の影響を受けやすい
論文 参考訳(メタデータ) (2024-11-14T06:43:37Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Parallel Proportional Fusion of Spiking Quantum Neural Network for Optimizing Image Classification [10.069224006497162]
量子・スパイキングニューラルネットワーク(PPF-QSNN)の並列比例融合(Parallel Proportional Fusion of Quantum and Spiking Neural Networks)と呼ばれる新しいアーキテクチャを導入する。
提案したPPF-QSNNは、既存のスパイクニューラルネットワークと、精度、損失、ロバストネスといったメトリクスにわたるシリアル量子ニューラルネットワークの両方より優れている。
本研究は、人工知能計算における量子優位性の発展と応用の基盤となるものである。
論文 参考訳(メタデータ) (2024-04-01T10:35:35Z) - Quantum Annealing and Graph Neural Networks for Solving TSP with QUBO [0.0]
本稿では、量子アニーリングアルゴリズムとグラフニューラルネットワークによるトラベリングセールスマン問題(TSP)の解法として、二次非拘束バイナリ最適化(QUBO)モデルの適用について検討する。
TSP(QGNN-TSP)のためのグラフニューラルネットワークソリューションを導入し、問題の基盤構造を学習し、QUBOに基づく損失関数の勾配降下による競合ソリューションを生成する。
論文 参考訳(メタデータ) (2024-02-21T05:55:00Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z) - Multi-Timescale Ensemble Q-learning for Markov Decision Process Policy
Optimization [21.30645601474163]
元々のQ-ラーニングは、非常に大きなネットワークにわたるパフォーマンスと複雑性の課題に悩まされている。
従来のQ-ラーニングに適応したモデルフリーアンサンブル強化学習アルゴリズムを提案する。
計算結果から,提案アルゴリズムは平均ポリシエラーを最大55%,実行時複雑性を最大50%削減できることがわかった。
論文 参考訳(メタデータ) (2024-02-08T08:08:23Z) - EPTQ: Enhanced Post-Training Quantization via Hessian-guided Network-wise Optimization [3.3998740964877463]
量子化は、メモリと計算リソースが限られているエッジデバイスにディープニューラルネットワークをデプロイするための重要な方法である。
本稿では,ネットワークワイド量子化最適化プロセスを用いたEPTQ(Post-Training Quantization)の高速化手法を提案する。
論文 参考訳(メタデータ) (2023-09-20T10:50:28Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - A Deep-Unfolded Reference-Based RPCA Network For Video
Foreground-Background Separation [86.35434065681925]
本稿では,ロバスト主成分分析(RPCA)問題に対するディープアンフォールディングに基づくネットワーク設計を提案する。
既存の設計とは異なり,本手法は連続するビデオフレームのスパース表現間の時間的相関をモデル化することに焦点を当てている。
移動MNISTデータセットを用いた実験により、提案したネットワークは、ビデオフォアグラウンドとバックグラウンドの分離作業において、最近提案された最先端のRPCAネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T11:40:09Z) - Optimistic Exploration even with a Pessimistic Initialisation [57.41327865257504]
最適初期化は強化学習(RL)における効率的な探索のための効果的な戦略である
特に、正の報酬しか持たないシナリオでは、Q-値はその最低値で初期化される。
本稿では、ニューラルネットワークから楽観性の源を分離する、悲観的に初期化されたQ値に対する単純なカウントベースの拡張を提案する。
論文 参考訳(メタデータ) (2020-02-26T17:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。