論文の概要: One model Packs Thousands of Items with Recurrent Conditional Query
Learning
- arxiv url: http://arxiv.org/abs/2111.06726v1
- Date: Fri, 12 Nov 2021 14:00:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 18:59:26.607424
- Title: One model Packs Thousands of Items with Recurrent Conditional Query
Learning
- Title(参考訳): 1つのモデルが繰り返し条件付きクエリ学習で何千ものアイテムを詰め込む
- Authors: Dongda Li, Zhaoquan Gu, Yuexuan Wang, Changwei Ren, Francis C.M. Lau
- Abstract要約: 本稿では,2次元および3次元のパッキング問題を解決するためにRCQL法を提案する。
RCQLは、オフラインの2D 40-boxケースでは平均ビンギャップ比を1.83%削減し、3Dケースでは7.84%削減する。
- 参考スコア(独自算出の注目度): 8.821298331302563
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent studies have revealed that neural combinatorial optimization (NCO) has
advantages over conventional algorithms in many combinatorial optimization
problems such as routing, but it is less efficient for more complicated
optimization tasks such as packing which involves mutually conditioned action
spaces. In this paper, we propose a Recurrent Conditional Query Learning (RCQL)
method to solve both 2D and 3D packing problems. We first embed states by a
recurrent encoder, and then adopt attention with conditional queries from
previous actions. The conditional query mechanism fills the information gap
between learning steps, which shapes the problem as a Markov decision process.
Benefiting from the recurrence, a single RCQL model is capable of handling
different sizes of packing problems. Experiment results show that RCQL can
effectively learn strong heuristics for offline and online strip packing
problems (SPPs), outperforming a wide range of baselines in space utilization
ratio. RCQL reduces the average bin gap ratio by 1.83% in offline 2D 40-box
cases and 7.84% in 3D cases compared with state-of-the-art methods. Meanwhile,
our method also achieves 5.64% higher space utilization ratio for SPPs with
1000 items than the state of the art.
- Abstract(参考訳): 最近の研究では、ニューラルネットワーク最適化(nco)はルーティングのような多くの組合せ最適化問題において従来のアルゴリズムよりも優れているが、相互条件付きアクション空間を含むパッキングのようなより複雑な最適化タスクでは効率が低いことが示されている。
本稿では,2次元および3次元のパッキング問題を解決するために,Recurrent Conditional Query Learning (RCQL)法を提案する。
まず、リカレントエンコーダによって状態を埋め込み、その後、前回のアクションから条件付きクエリで注意を払います。
条件付きクエリ機構は、マルコフ決定プロセスとして問題を形成する学習ステップ間の情報ギャップを埋める。
再帰性に相応しい1つのRCQLモデルは、パッキング問題のさまざまなサイズを扱うことができる。
実験の結果、RCQLはオフラインおよびオンラインストリップパッキング問題(SPP)の強いヒューリスティックスを効果的に学習でき、空間利用率において幅広いベースラインを上回ります。
RCQLは、オフラインの2D 40ボックスケースでは平均ビンギャップ比を1.83%削減し、3Dケースでは7.84%削減する。
一方,本手法は,1000項目のSPPの空間利用率を技術状況よりも5.64%向上させる。
関連論文リスト
- Adaptive Retrieval and Scalable Indexing for k-NN Search with Cross-Encoders [77.84801537608651]
クエリ-イムペアを共同で符号化することで類似性を計算するクロスエンコーダ(CE)モデルは、クエリ-イム関連性を推定する埋め込みベースモデル(デュアルエンコーダ)よりも優れている。
本稿では,潜時クエリとアイテム埋め込みを効率的に計算してCEスコアを近似し,CE類似度を近似したk-NN探索を行うスパース行列分解法を提案する。
論文 参考訳(メタデータ) (2024-05-06T17:14:34Z) - Advancing LLM Reasoning Generalists with Preference Trees [119.57169648859707]
推論に最適化された大規模言語モデル(LLM)のスイートであるEulusを紹介する。
Eurusモデルは、様々なベンチマークでオープンソースのモデルの間で最先端の結果を得る。
論文 参考訳(メタデータ) (2024-04-02T16:25:30Z) - Learning based 2D Irregular Shape Packing [29.044043493942013]
2次元不規則な形状パッキングは、3次元モデルのUVパッチをテクスチャアトラス内に配置するために必要なステップであり、コンピュータグラフィックスにおけるメモリ効率の高い外観レンダリングを実現する。
本稿では,学習支援型2次元不規則形状パッキング手法を提案する。
数百のパッチで大きな問題インスタンスを効率的に処理するために、私たちは、ほぼ矩形のパッチサブセットを予測するために、ディープニューラルネットワークポリシーをトレーニングします。
論文 参考訳(メタデータ) (2023-09-19T05:21:52Z) - SqueezeLLM: Dense-and-Sparse Quantization [80.32162537942138]
LLMにおける生成推論の主なボトルネックは、単一のバッチ推論のための計算ではなく、メモリ帯域幅である。
学習後量子化フレームワークであるSqueezeLLMを導入し、最大3ビットの超低精度でのロスレス圧縮を実現する。
本フレームワークは,2次情報に基づく最適ビット精度割当を探索する感度ベース非一様量子化法と,2次情報に基づくDense-and-Sparse分解法と,2次情報量割当値と感度重み値を効率的にスパース形式で格納するDense-and-Sparse分解法である。
論文 参考訳(メタデータ) (2023-06-13T08:57:54Z) - Supplementing Recurrent Neural Networks with Annealing to Solve
Combinatorial Optimization Problems [2.3642391095636484]
本稿では,実世界の最適化問題に対するアプローチとして,変分古典アニール (VCA) を用いる可能性を示す。
以上の結果から, VCA は相対誤差の点で, 平均1桁以上の限界でアニーリング (SA) を平均的に上回ることがわかった。
ベストケースシナリオでは、SAが最適解を見つけられなかった場合、VCAは優れた代替手段として機能する、と結論付けます。
論文 参考訳(メタデータ) (2022-07-17T14:33:17Z) - LassoBench: A High-Dimensional Hyperparameter Optimization Benchmark
Suite for Lasso [84.6451154376526]
LassoBenchは、Lassoコミュニティで重要なオープンリサーチトピックに適した、新しいベンチマークスイートである。
我々は5つの最先端HPO法と3つのベースラインを評価し、ベイズ最適化が、特にスパース回帰によく用いられる手法よりも改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-04T12:05:09Z) - Pack Together: Entity and Relation Extraction with Levitated Marker [61.232174424421025]
エンコーダにマーカを戦略的にパッケージ化することにより,スパン(ペア)間の依存関係を検討するために,Packed Levitated Markersという新しいスパン表現手法を提案する。
実験の結果,3つの平坦なNERタスクにおいて,有望なマーカーが充填されたモデルの方がシーケンスラベルモデルよりも0.4%-1.9%優れ,トークンコンキャットモデルを6つのNERベンチマークで上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-13T15:38:13Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Solve routing problems with a residual edge-graph attention neural
network [10.42872026679616]
本稿では,NP-ハード最適化問題を解決するために,エンドツーエンドの深層強化学習フレームワークを提案する。
提案するフレームワークは、ニューラルネットワークモデルとトレーニングアルゴリズムの観点から、リテラシーのモデルを改善することを目指している。
具体的には、平均最適性ギャップは、100ノードのTSPで4.53%(ベスト citeR22として報告)から3.67%(ベスト citeR22で報告)、100ノードのCVRPで7.34%(ベスト citeR22で報告)から6.68%に縮小される。
論文 参考訳(メタデータ) (2021-05-06T14:47:47Z) - A threshold search based memetic algorithm for the disjunctively
constrained knapsack problem [21.803219880299764]
可逆的制約付きクナプサック問題は、容量制約付きクナプサックにペア互換の項目のサブセットをパックすることである。
そこで我々は, DCKP を解くためのしきい値探索に基づくメメティクスアルゴリズムを提案し, メメティクスフレームワークとしきい値探索を組み合わせた高品質な解を求める。
論文 参考訳(メタデータ) (2021-01-12T21:07:33Z) - Lookahead-Bounded Q-Learning [8.738692817482526]
本稿では,新しいQ-ラーニング法であるルックアヘッドバウンドQ-ラーニングアルゴリズム(LBQL)を紹介する。
われわれのアプローチは、高価なシミュレーションや現実世界の対話を必要とする問題に特に魅力的である。
論文 参考訳(メタデータ) (2020-06-28T19:50:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。