論文の概要: TAP-Net: Transport-and-Pack using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2009.01469v1
- Date: Thu, 3 Sep 2020 06:20:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 07:51:52.832044
- Title: TAP-Net: Transport-and-Pack using Reinforcement Learning
- Title(参考訳): TAP-Net:強化学習を用いたトランスポート・アンド・パック
- Authors: Ruizhen Hu, Juzhan Xu, Bin Chen, Minglun Gong, Hao Zhang, Hui Huang
- Abstract要約: 本稿では,実世界のパッキングにおいて頻繁に発生するTAP(Transport-and-pack)問題を紹介する。
我々は強化学習に基づくニューラル最適化ソリューションを開発した。
我々のネットワークは、小さな入力で訓練された場合、より大きな問題インスタンスに対してよく一般化されることを示す。
- 参考スコア(独自算出の注目度): 25.884588673613244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce the transport-and-pack(TAP) problem, a frequently encountered
instance of real-world packing, and develop a neural optimization solution
based on reinforcement learning. Given an initial spatial configuration of
boxes, we seek an efficient method to iteratively transport and pack the boxes
compactly into a target container. Due to obstruction and accessibility
constraints, our problem has to add a new search dimension, i.e., finding an
optimal transport sequence, to the already immense search space for packing
alone. Using a learning-based approach, a trained network can learn and encode
solution patterns to guide the solution of new problem instances instead of
executing an expensive online search. In our work, we represent the transport
constraints using a precedence graph and train a neural network, coined
TAP-Net, using reinforcement learning to reward efficient and stable packing.
The network is built on an encoder-decoder architecture, where the encoder
employs convolution layers to encode the box geometry and precedence graph and
the decoder is a recurrent neural network (RNN) which inputs the current
encoder output, as well as the current box packing state of the target
container, and outputs the next box to pack, as well as its orientation. We
train our network on randomly generated initial box configurations, without
supervision, via policy gradients to learn optimal TAP policies to maximize
packing efficiency and stability. We demonstrate the performance of TAP-Net on
a variety of examples, evaluating the network through ablation studies and
comparisons to baselines and alternative network designs. We also show that our
network generalizes well to larger problem instances, when trained on
small-sized inputs.
- Abstract(参考訳): 本稿では,実世界のパッキングにおいて頻繁に発生するTAP問題を紹介し,強化学習に基づくニューラル最適化ソリューションを開発する。
箱の初期空間構成を考えると、箱をターゲットの容器にコンパクトに移動し、パックする効率的な方法を求める。
障害とアクセシビリティの制約により、我々は、パッキングだけで既に巨大な検索空間に最適なトランスポートシーケンスを見つけるという新しい検索次元を追加する必要がある。
学習ベースのアプローチを使用して、トレーニングされたネットワークは、高価なオンライン検索を実行する代わりに、ソリューションパターンを学び、エンコードすることで、新しい問題インスタンスのソリューションをガイドすることができる。
本研究では,先行グラフを用いて輸送制約を表現し,ニューラルネットワークであるtap-netを訓練し,強化学習を用いて効率良く安定したパッキングを報奨する。
ネットワークは、エンコーダ-デコーダアーキテクチャに基づいて構築され、エンコーダは、ボックスの幾何学と優先順位グラフをエンコードするために畳み込み層を使用し、デコーダは、現在のエンコーダ出力とターゲットコンテナの現在のボックスパック状態とを入力し、次のボックスをパックに出力するリカレントニューラルネットワーク(RNN)である。
ネットワークを無監督でランダムに生成した初期ボックス構成でトレーニングし、パッキング効率と安定性を最大化するために最適なTAPポリシーを学習する。
様々な例でtap-netの性能を実証し,アブレーション研究によるネットワーク評価を行い,ベースラインや代替ネットワーク設計との比較を行った。
また、我々のネットワークは、小さな入力でトレーニングされた場合に、より大きな問題インスタンスにうまく一般化することを示している。
関連論文リスト
- Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - Neural Packing: from Visual Sensing to Reinforcement Learning [24.35678534893451]
本稿では,3DでTAP(Transport-and-packing)問題を解決するための新しい学習フレームワークを提案する。
RGBDセンシングと認識による入力オブジェクトの部分的な観察から、ロボットモーション計画による最終ボックス配置に至るまで、完全なソリューションパイプラインを構成し、ターゲットコンテナ内のコンパクトパッキングに到達する。
論文 参考訳(メタデータ) (2023-10-17T02:42:54Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Pathfinding Neural Cellular Automata [23.831530224401575]
Pathfindingは、ロボットパス計画、トランスポートルーティング、ゲームプレイなど、幅広い複雑なAIタスクの重要なサブコンポーネントである。
我々は, Breadth-First Search (BFS) のモデル,すなわち最短経路探索のハンドコードと学習を行う。
本稿では、Depth-First Search(DFS)のニューラル実装を提案し、グラフの直径を計算するためのNAAを生成するために、ニューラルネットワークBFSと組み合わせる方法について概説する。
我々は,これらの手書きNCAに触発されたアーキテクチャ変更を実験し,グリッド迷路の直径問題を解くためにゼロからネットワークをトレーニングし,高い能力の一般化を示した。
論文 参考訳(メタデータ) (2023-01-17T11:45:51Z) - Robust Training and Verification of Implicit Neural Networks: A
Non-Euclidean Contractive Approach [64.23331120621118]
本稿では,暗黙的ニューラルネットワークのトレーニングとロバスト性検証のための理論的および計算的枠組みを提案する。
組込みネットワークを導入し、組込みネットワークを用いて、元のネットワークの到達可能な集合の超近似として$ell_infty$-normボックスを提供することを示す。
MNISTデータセット上で暗黙的なニューラルネットワークをトレーニングするためにアルゴリズムを適用し、我々のモデルの堅牢性と、文献における既存のアプローチを通じてトレーニングされたモデルを比較する。
論文 参考訳(メタデータ) (2022-08-08T03:13:24Z) - Routing with Self-Attention for Multimodal Capsule Networks [108.85007719132618]
我々は,カプセルの強度をマルチモーダル学習フレームワークの文脈で活用できる,新しいマルチモーダルカプセルネットワークを提案する。
カプセルを大規模入力データに適応させるために, カプセルを選択する自己保持機構による新たなルーティングを提案する。
これにより、ノイズの多いビデオデータによる堅牢なトレーニングだけでなく、従来のルーティング方法と比較してカプセルネットワークのサイズを拡大することが可能になる。
論文 参考訳(メタデータ) (2021-12-01T19:01:26Z) - Optimal Transport Based Refinement of Physics-Informed Neural Networks [0.0]
我々は、最適輸送(OT)の概念に基づく偏微分方程式(PDE)の解法として、よく知られた物理情報ニューラルネットワーク(PINN)の改良戦略を提案する。
PINNの解法は、完全接続された病理のスペクトルバイアス、不安定な勾配、収束と精度の難しさなど、多くの問題に悩まされている。
本稿では,既存の PINN フレームワークを補完する OT-based sample を用いて,Fokker-Planck-Kolmogorov Equation (FPKE) を解くための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-05-26T02:51:20Z) - Relational Deep Reinforcement Learning for Routing in Wireless Networks [2.997420836766863]
我々は,トラフィックパターン,混雑レベル,ネットワーク接続性,リンクダイナミクスを一般化した,深層強化学習に基づく分散ルーティング戦略を開発した。
提案アルゴリズムは,パケットの配送やパケット毎の遅延に対して,最短経路とバックプレッシャルーティングに優れる。
論文 参考訳(メタデータ) (2020-12-31T16:28:21Z) - Synthesis and Pruning as a Dynamic Compression Strategy for Efficient
Deep Neural Networks [1.8275108630751844]
本稿では,学習時の脳の行動から直接引き出す,フィードフォワードネットワークのための新しい戦略的合成アルゴリズムを提案する。
ランダム選択を提唱する既存のアプローチとは異なり、我々は高いパフォーマンスのノードを新しいエッジの出発点として選択する。
この戦略は、有用な接続を生成し、結果としてネットワーク構造を小さくすることを目的としている。
論文 参考訳(メタデータ) (2020-11-23T12:30:57Z) - Dynamic Graph: Learning Instance-aware Connectivity for Neural Networks [78.65792427542672]
動的グラフネットワーク(DG-Net)は完全な有向非巡回グラフであり、ノードは畳み込みブロックを表し、エッジは接続経路を表す。
ネットワークの同じパスを使用する代わりに、DG-Netは各ノードの機能を動的に集約する。
論文 参考訳(メタデータ) (2020-10-02T16:50:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。