論文の概要: Solve Traveling Salesman Problem by Monte Carlo Tree Search and Deep
Neural Network
- arxiv url: http://arxiv.org/abs/2005.06879v1
- Date: Thu, 14 May 2020 11:36:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 04:20:40.599996
- Title: Solve Traveling Salesman Problem by Monte Carlo Tree Search and Deep
Neural Network
- Title(参考訳): モンテカルロ木探索とディープニューラルネットワークによる旅行セールスマン問題の解法
- Authors: Zhihao Xing, Shikui Tu, Lei Xu
- Abstract要約: 本稿では,モンテカルロ木探索と深層強化学習を組み合わせた自己学習手法を提案する。
実験結果から,提案手法は小口径問題設定において,他の手法に対して良好に動作することがわかった。
大規模な問題設定では、最先端のパフォーマンスに匹敵するパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 8.19063619210761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a self-learning approach that combines deep reinforcement learning
and Monte Carlo tree search to solve the traveling salesman problem. The
proposed approach has two advantages. First, it adopts deep reinforcement
learning to compute the value functions for decision, which removes the need of
hand-crafted features and labelled data. Second, it uses Monte Carlo tree
search to select the best policy by comparing different value functions, which
increases its generalization ability. Experimental results show that the
proposed method performs favorably against other methods in small-to-medium
problem settings. And it shows comparable performance as state-of-the-art in
large problem setting.
- Abstract(参考訳): 本稿では,旅行セールスマン問題を解決するために,深い強化学習とモンテカルロ木探索を組み合わせた自己学習手法を提案する。
提案手法には2つの利点がある。
まず、決定のための値関数を計算するために深層強化学習を採用し、手作りの機能やラベル付きデータの必要性を取り除く。
第二に、モンテカルロ木探索を用いて、異なる値関数を比較して最良のポリシーを選択することで、一般化能力を高める。
実験の結果,提案手法は中小問題において他の手法に対して有利に動作することがわかった。
そして、大きな問題設定において最先端のパフォーマンスと同等のパフォーマンスを示している。
関連論文リスト
- Maneuver Decision-Making Through Proximal Policy Optimization And Monte
Carlo Tree Search [0.0]
真面目な意思決定はマルコフ決定過程と見なすことができ、強化学習によって対処することができる。
エージェントはトレーニングの初期段階でランダムなアクションを使用するため、報酬を得るのが難しく、効果的な意思決定方法を学ぶのが難しい。
近似ポリシー最適化とモンテカルロ木探索に基づく手法を提案する。
論文 参考訳(メタデータ) (2023-08-28T14:48:49Z) - TreeDQN: Learning to minimize Branch-and-Bound tree [78.52895577861327]
Branch-and-Boundは、Mixed Linear Programsという形で最適化タスクを解決するための便利なアプローチである。
解法の効率は、分割する変数を選択するのに使用される分岐に依存する。
分岐を効率的に学習できる強化学習法を提案する。
論文 参考訳(メタデータ) (2023-06-09T14:01:26Z) - Feature Acquisition using Monte Carlo Tree Search [18.76745359031975]
特徴獲得アルゴリズムは、MLモデルの学習性能を向上させるために、取得コストのバランスを保ちながら、情報的特徴を取得する問題に対処する。
従来のアプローチでは, 獲得シーケンスを決定するために, 期待される特徴の効用値を計算することに重点を置いてきた。
従来の手法と比較して,1) 特徴獲得問題を MDP として定式化し,モンテカルロ木探索を適用すること,2) モデルの改良と獲得コストに基づいて各獲得ステップの中間報酬を計算すること,3) 多目的モンテカルロ木探索を用いてモデル改善と取得コストを同時に最適化することに焦点を当てた。
論文 参考訳(メタデータ) (2022-12-21T20:53:44Z) - McXai: Local model-agnostic explanation as two games [5.2229999775211216]
この研究はモンテカルロ木探索(Monte Carlo tree search for eXplainable Artificial Intelligent, McXai)と呼ばれる強化学習に基づくアプローチを導入し、ブラックボックス分類モデル(分類器)の決定について説明する。
実験の結果, LIME や SHAP などの古典的手法に比べて,本手法の特徴は分類に関してより有益であることが示唆された。
論文 参考訳(メタデータ) (2022-01-04T09:02:48Z) - Exploring Bayesian Deep Learning for Urgent Instructor Intervention Need
in MOOC Forums [58.221459787471254]
大規模なオープンオンラインコース(MOOC)は、その柔軟性のおかげで、eラーニングの一般的な選択肢となっている。
多くの学習者とその多様な背景から、リアルタイムサポートの提供は課税されている。
MOOCインストラクターの大量の投稿と高い作業負荷により、インストラクターが介入を必要とするすべての学習者を識別できる可能性は低いです。
本稿では,モンテカルロドロップアウトと変分推論という2つの手法を用いて,学習者によるテキスト投稿のベイジアン深層学習を初めて検討する。
論文 参考訳(メタデータ) (2021-04-26T15:12:13Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - BCFNet: A Balanced Collaborative Filtering Network with Attention
Mechanism [106.43103176833371]
協調フィルタリング(CF)ベースの推奨方法が広く研究されている。
BCFNet(Balanced Collaborative Filtering Network)という新しい推薦モデルを提案する。
さらに注意機構は、暗黙のフィードバックの中で隠れた情報をよりよく捉え、ニューラルネットワークの学習能力を強化するように設計されている。
論文 参考訳(メタデータ) (2021-03-10T14:59:23Z) - Costly Features Classification using Monte Carlo Tree Search [5.188762991286163]
我々は,特徴のサブセットを順次選択し,特徴の分類誤差と特徴コストのバランスをとる,コストの高い特徴の分類の問題を考える。
本稿では,まずMDP問題にタスクを投入し,Advantage Actor Criticアルゴリズムを用いて解決する。
論文 参考訳(メタデータ) (2021-02-14T05:18:33Z) - Deep Reinforcement Learning of Graph Matching [63.469961545293756]
ノードとペアの制約下でのグラフマッチング(GM)は、最適化からコンピュータビジョンまでの領域におけるビルディングブロックである。
GMのための強化学習ソルバを提案する。
rgmはペアワイズグラフ間のノード対応を求める。
本手法は,フロントエンドの特徴抽出と親和性関数学習に焦点をあてるという意味において,従来のディープグラフマッチングモデルと異なる。
論文 参考訳(メタデータ) (2020-12-16T13:48:48Z) - Towards Improved and Interpretable Deep Metric Learning via Attentive
Grouping [103.71992720794421]
グループ化は、様々な特徴の計算にディープ・メトリック・ラーニングでよく用いられてきた。
本稿では,任意のメトリクス学習フレームワークと柔軟に統合可能な,改良された解釈可能なグループ化手法を提案する。
論文 参考訳(メタデータ) (2020-11-17T19:08:24Z) - Exploring search space trees using an adapted version of Monte Carlo
tree search for combinatorial optimization problems [0.6882042556551609]
このアプローチでは,問題インスタンスの探索空間木を探索するアルゴリズムを用いる。
このアルゴリズムはモンテカルロ木探索(Monte Carlo tree search)をベースとしている。
論文 参考訳(メタデータ) (2020-10-22T08:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。