論文の概要: Learning to Iteratively Solve Routing Problems with Dual-Aspect
Collaborative Transformer
- arxiv url: http://arxiv.org/abs/2110.02544v1
- Date: Wed, 6 Oct 2021 07:21:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-07 14:42:02.097302
- Title: Learning to Iteratively Solve Routing Problems with Dual-Aspect
Collaborative Transformer
- Title(参考訳): デュアルアスペクト協調変換器による経路問題の反復解法
- Authors: Yining Ma, Jingwen Li, Zhiguang Cao, Wen Song, Le Zhang, Zhenghua
Chen, Jing Tang
- Abstract要約: 本稿では、ノードの埋め込みと位置特徴を別々に学習するDACT(Dual-Aspect Collaborative Transformer)を提案する。
位置特徴は、トランスフォーマーがVRP溶液の円度と対称性を効果的に捉えられるように、新しいサイクリック位置符号化(CPE)法によって埋め込まれている。
- 参考スコア(独自算出の注目度): 14.680514752270375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, Transformer has become a prevailing deep architecture for solving
vehicle routing problems (VRPs). However, it is less effective in learning
improvement models for VRP because its positional encoding (PE) method is not
suitable in representing VRP solutions. This paper presents a novel Dual-Aspect
Collaborative Transformer (DACT) to learn embeddings for the node and
positional features separately, instead of fusing them together as done in
existing ones, so as to avoid potential noises and incompatible correlations.
Moreover, the positional features are embedded through a novel cyclic
positional encoding (CPE) method to allow Transformer to effectively capture
the circularity and symmetry of VRP solutions (i.e., cyclic sequences). We
train DACT using Proximal Policy Optimization and design a curriculum learning
strategy for better sample efficiency. We apply DACT to solve the traveling
salesman problem (TSP) and capacitated vehicle routing problem (CVRP). Results
show that our DACT outperforms existing Transformer based improvement models,
and exhibits much better generalization performance across different problem
sizes on synthetic and benchmark instances, respectively.
- Abstract(参考訳): 近年,トランスフォーマーは車両ルーティング問題(VRP)の解法として広く普及している。
しかし、位置符号化(PE)法はVRPソリューションの表現に適さないため、VRPの改善モデルの学習にはあまり効果がない。
本稿では,ノードと位置特徴の埋め込みを個別に学習するDACT(Dual-Aspect Collaborative Transformer)を提案する。
さらに、新しいサイクリック位置符号化(cpe)法によって位置特徴を埋め込み、トランスフォーマーがvrp溶液(すなわちサイクリックシーケンス)の循環性と対称性を効果的に捉えることができる。
我々は、近似ポリシー最適化を用いてDACTを訓練し、より優れたサンプル効率のためのカリキュラム学習戦略を設計する。
本研究では,移動セールスマン問題 (TSP) と静電容量化車両ルーティング問題 (CVRP) の解決に DACT を適用した。
その結果、DACTは既存のTransformerベースの改善モデルよりも優れており、合成インスタンスとベンチマークインスタンスの異なる問題サイズで、より優れた一般化性能を示すことがわかった。
関連論文リスト
- Joint Transmit and Pinching Beamforming for PASS: Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。
それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。
PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文 参考訳(メタデータ) (2025-02-12T18:54:10Z) - CAMP: Collaborative Attention Model with Profiles for Vehicle Routing Problems [15.136899433821894]
プロファイル車両ルーティング問題(PVRP)は、異種静電容量車両ルーティング問題(HCVRP)の一般化である。
マルチエージェント強化学習を用いてPVRPの効率的な解法を学習する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-06T12:37:56Z) - PearSAN: A Machine Learning Method for Inverse Design using Pearson Correlated Surrogate Annealing [66.27103948750306]
PearSANは、大きな設計空間を持つ逆設計問題に適用可能な機械学習支援最適化アルゴリズムである。
ピアソン相関代理モデルを用いて、真の設計計量のメリットの図形を予測する。
最先端の最大設計効率は97%で、少なくとも以前の方法よりも桁違いに高速である。
論文 参考訳(メタデータ) (2024-12-26T17:02:19Z) - Adaptive Step-size Perception Unfolding Network with Non-local Hybrid Attention for Hyperspectral Image Reconstruction [0.39134031118910273]
FISTAアルゴリズムに基づく深層展開ネットワークであるASPUNを提案する。
さらに,非局所的ハイブリッドアテンショントランス (NHAT) モジュールを設計し,コンバータの受容場特性をフル活用する。
実験の結果, ASPUNは既存のSOTAアルゴリズムよりも優れ, 最高の性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-07-04T16:09:52Z) - Cross-Problem Learning for Solving Vehicle Routing Problems [24.212686893913826]
既存のニューラルネットワークは、特定の車両ルーティング問題(VRP)に対して、スクラッチから深いアーキテクチャを訓練することが多い。
本稿では,異なる下流VRP変種に対するトレーニングを実証的に支援するクロスプロブレム学習を提案する。
論文 参考訳(メタデータ) (2024-04-17T18:17:50Z) - Efficient Adaptation of Large Vision Transformer via Adapter
Re-Composing [8.88477151877883]
高容量事前学習モデルはコンピュータビジョンにおける問題解決に革命をもたらした。
本稿では,効率的な事前学習モデル適応に対処する新しい適応型再コンパイル(ARC)戦略を提案する。
提案手法は適応パラメータの再利用可能性について考察し,パラメータ共有方式を提案する。
論文 参考訳(メタデータ) (2023-10-10T01:04:15Z) - Decision S4: Efficient Sequence-Based RL via State Spaces Layers [87.3063565438089]
我々は、S4モデルの訓練効率を維持しつつ、軌道で機能する非政治的な訓練手順を提案する。
反復的に訓練され、長距離依存の恩恵を受け、新しい安定したアクター・クリティカルなメカニズムをベースとした、オンデマンドのトレーニング手順。
論文 参考訳(メタデータ) (2023-06-08T13:03:53Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Full Stack Optimization of Transformer Inference: a Survey [58.55475772110702]
トランスフォーマーモデルは広範囲のアプリケーションにまたがって優れた精度を実現する。
最近のTransformerモデルの推測に必要な計算量と帯域幅は、かなり増加しています。
Transformerモデルをより効率的にすることに注力している。
論文 参考訳(メタデータ) (2023-02-27T18:18:13Z) - Learning Vehicle Routing Problems using Policy Optimisation [4.093722933440819]
最先端のアプローチは強化学習を使ってポリシーを学習し、学習ポリシーは擬似解法として機能する。
これらのアプローチは、あるケースでは優れた性能を示しているが、ルーティング問題に典型的な大きな検索空間を考えると、ポリシーの貧弱さに早すぎる可能性がある。
より多くのポリシーを提供することで探索を支援するエントロピー正規化強化学習(ERRL)を提案する。
論文 参考訳(メタデータ) (2020-12-24T14:18:56Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。