論文の概要: Mitigating Dimensionality in 2D Rectangle Packing Problem under Reinforcement Learning Schema
- arxiv url: http://arxiv.org/abs/2409.09677v1
- Date: Sun, 15 Sep 2024 09:58:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 19:48:24.038383
- Title: Mitigating Dimensionality in 2D Rectangle Packing Problem under Reinforcement Learning Schema
- Title(参考訳): 強化学習方式における2次元矩形充填問題における寸法の緩和
- Authors: Waldemar Kołodziejczyk, Mariusz Kaleta,
- Abstract要約: 本稿では,2次元矩形パッキング問題に対する強化学習(RL)の適用について検討する。
本研究では,高粒度化を実現する状態空間と行動空間の縮小表現を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper explores the application of Reinforcement Learning (RL) to the two-dimensional rectangular packing problem. We propose a reduced representation of the state and action spaces that allow us for high granularity. Leveraging UNet architecture and Proximal Policy Optimization (PPO), we achieved a model that is comparable to the MaxRect heuristic. However, our approach has great potential to be generalized to nonrectangular packing problems and complex constraints.
- Abstract(参考訳): 本稿では,2次元矩形パッキング問題に対する強化学習(RL)の適用について検討する。
本研究では,高粒度化を実現する状態空間と行動空間の縮小表現を提案する。
UNetアーキテクチャとPPOを活用することで、MaxRectヒューリスティックに匹敵するモデルを実現しました。
しかし,本手法は非矩形包装問題や複雑な制約に一般化される可能性が大きい。
関連論文リスト
- Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds [59.875550175217874]
本稿では,オンラインとオフラインのRL設定において,モデルベース強化学習方式が強い後悔とサンプル境界を実現することを示す。
我々のアルゴリズムは単純で、かなり標準的であり、実際にRLの文献で広く研究されている。
論文 参考訳(メタデータ) (2024-08-16T19:52:53Z) - Concise Plane Arrangements for Low-Poly Surface and Volume Modelling [9.254047358707016]
複雑な物体とシーン全体に対する平面配置の構築を可能にする2つの重要なノベルティを紹介する。
提案手法は,様々なデータセットの学習ベースおよび従来のアプローチと比較することにより,最先端の結果につながることを示す。
論文 参考訳(メタデータ) (2024-04-09T09:27:54Z) - Double Duality: Variational Primal-Dual Policy Optimization for
Constrained Reinforcement Learning [132.7040981721302]
本研究では,訪問尺度の凸関数を最小化することを目的として,制約付き凸決定プロセス(MDP)について検討する。
制約付き凸MDPの設計アルゴリズムは、大きな状態空間を扱うなど、いくつかの課題に直面している。
論文 参考訳(メタデータ) (2024-02-16T16:35:18Z) - High-dimensional Linear Bandits with Knapsacks [8.862707047517913]
特徴量が大きい高次元条件下で,knapsack (CBwK) 問題を用いた文脈的帯域幅について検討した。
本研究では,スパース推定をオンラインで行うハードしきい値アルゴリズムのオンライン版を開発する。
この統合されたアプローチは、特徴次元に対数的に依存するサブリニアな後悔を達成できることを示す。
論文 参考訳(メタデータ) (2023-11-02T15:40:33Z) - Learning Gradient Fields for Scalable and Generalizable Irregular
Packing [28.814796920026172]
パッキング問題(英: packing problem)は、切断またはネスト(英: cutting or nesting)としても知られ、物流、製造、レイアウト設計、アトラス生成に様々な応用がある。
機械学習の最近の進歩、特に強化学習は、梱包問題に対処する上で有望であることを示している。
本研究では, 条件付き生成モデルとしてパッキング問題を定式化する, 機械学習に基づく新しい手法を深く研究する。
論文 参考訳(メタデータ) (2023-10-18T15:52:55Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Learning based 2D Irregular Shape Packing [29.044043493942013]
2次元不規則な形状パッキングは、3次元モデルのUVパッチをテクスチャアトラス内に配置するために必要なステップであり、コンピュータグラフィックスにおけるメモリ効率の高い外観レンダリングを実現する。
本稿では,学習支援型2次元不規則形状パッキング手法を提案する。
数百のパッチで大きな問題インスタンスを効率的に処理するために、私たちは、ほぼ矩形のパッチサブセットを予測するために、ディープニューラルネットワークポリシーをトレーニングします。
論文 参考訳(メタデータ) (2023-09-19T05:21:52Z) - Lifting the Convex Conjugate in Lagrangian Relaxations: A Tractable
Approach for Continuous Markov Random Fields [53.31927549039624]
断片的な離散化は既存の離散化問題と矛盾しないことを示す。
この理論を2つの画像のマッチング問題に適用する。
論文 参考訳(メタデータ) (2021-07-13T12:31:06Z) - Taxonomy of Dual Block-Coordinate Ascent Methods for Discrete Energy
Minimization [96.1052289276254]
離散的グラフィカルモデルにおける最大姿勢推定問題と、二重ブロック座標法に基づく解法について考察する。
既存のすべてのソルバをひとつのフレームワークにマッピングし、設計原則をより深く理解できるようにします。
論文 参考訳(メタデータ) (2020-04-16T15:49:13Z) - Regret Minimization in Partially Observable Linear Quadratic Control [91.43582419264763]
モデル力学が未知の先行性を持つ場合、部分的に観測可能な線形二次制御系における後悔の問題を考察する。
本稿では, 部分的に観測可能な線形二次制御のために, 後悔を分解し, 終端から終端までの後悔の上限を与える新しい方法を提案する。
論文 参考訳(メタデータ) (2020-01-31T22:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。