論文の概要: Learning Algorithms for Regenerative Stopping Problems with Applications
to Shipping Consolidation in Logistics
- arxiv url: http://arxiv.org/abs/2105.02318v1
- Date: Wed, 5 May 2021 20:45:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 13:20:50.601880
- Title: Learning Algorithms for Regenerative Stopping Problems with Applications
to Shipping Consolidation in Logistics
- Title(参考訳): 再生停止問題の学習アルゴリズムと物流における輸送統合への応用
- Authors: Kishor Jothimurugan, Matthew Andrews, Jeongran Lee and Lorenzo Maggi
- Abstract要約: 制御器が停止し、長期平均コストを最小限に抑えると、システムが再起動する再生停止問題について検討する。
従来のモデルベースのソリューションは、推定モデルのためのデータとコンピューティング戦略から基礎となるプロセスを推定する。
シミュレーションからニューラルネットワークのポリシーを学習する深層強化学習と模擬学習とを比較します。
- 参考スコア(独自算出の注目度): 8.111251824291244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study regenerative stopping problems in which the system starts anew
whenever the controller decides to stop and the long-term average cost is to be
minimized. Traditional model-based solutions involve estimating the underlying
process from data and computing strategies for the estimated model. In this
paper, we compare such solutions to deep reinforcement learning and imitation
learning which involve learning a neural network policy from simulations. We
evaluate the different approaches on a real-world problem of shipping
consolidation in logistics and demonstrate that deep learning can be
effectively used to solve such problems.
- Abstract(参考訳): 制御器が停止し、長期平均コストを最小限に抑えると、システムが再起動する再生停止問題について検討する。
従来のモデルベースのソリューションは、推定モデルのためのデータとコンピューティング戦略から基礎となるプロセスを推定する。
本稿では,シミュレーションからニューラルネットワークポリシーを学習する深層強化学習と模倣学習を比較した。
我々は,ロジスティクスにおける出荷統合という現実世界の問題に対する異なるアプローチを評価し,これらの問題を解決するためにディープラーニングを効果的に活用できることを実証する。
関連論文リスト
- Model-Free Active Exploration in Reinforcement Learning [53.786439742572995]
強化学習における探索問題について検討し,新しいモデルフリーソリューションを提案する。
我々の戦略は、最先端の探査アプローチよりも高速に効率的な政策を特定できる。
論文 参考訳(メタデータ) (2024-06-30T19:00:49Z) - Dataless Quadratic Neural Networks for the Maximum Independent Set Problem [23.643727259409744]
本稿では、最大独立集合(MIS)問題に対する連続的な二次緩和を特徴とする、新しいデータレス2次ニューラルネットワークの定式化を提案する。
本手法では,MISインスタンスをトレーニング可能なエンティティとして扱うことにより,トレーニングデータの必要性を解消する。
ADAMのような勾配に基づく最適化を採用し、市販のGPU並列実装を効果的に活用することにより、我々の手法は最先端の学習ベース手法と比較して、競争力や優れた性能を示す。
論文 参考訳(メタデータ) (2024-06-27T21:12:48Z) - Liquid Neural Network-based Adaptive Learning vs. Incremental Learning for Link Load Prediction amid Concept Drift due to Network Failures [37.66676003679306]
概念の漂流に適応することは、機械学習において難しい課題である。
通信ネットワークでは、障害イベントの後に交通予報を行う際にこのような問題が生じる。
本稿では,適応学習アルゴリズム,すなわち,データパターンの急激な変化を,再学習を必要とせずに自己適応できる手法を提案する。
論文 参考訳(メタデータ) (2024-04-08T08:47:46Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Model-Based Reinforcement Learning Control of Reaction-Diffusion
Problems [0.0]
強化学習はいくつかのアプリケーション、特にゲームにおいて意思決定に応用されている。
輸送されたフィールドの流れを駆動する2つの新しい報酬関数を導入する。
その結果、これらのアプリケーションで特定の制御をうまく実装できることが判明した。
論文 参考訳(メタデータ) (2024-02-22T11:06:07Z) - Robust Deep Reinforcement Learning Scheduling via Weight Anchoring [7.570246812206769]
我々は、重みアンカーを用いてニューラルネットワークの望ましい振る舞いを培養し、固定する。
ウェイトアンカーは、他の学習問題の解に近い学習問題の解を見つけるために用いられる。
その結果,シミュレーション環境を増強する技術に匹敵する性能が得られた。
論文 参考訳(メタデータ) (2023-04-20T09:30:23Z) - The least-control principle for learning at equilibrium [65.2998274413952]
我々は、平衡反復ニューラルネットワーク、深層平衡モデル、メタラーニングを学ぶための新しい原理を提案する。
私たちの結果は、脳がどのように学習するかを明らかにし、幅広い機械学習問題にアプローチする新しい方法を提供します。
論文 参考訳(メタデータ) (2022-07-04T11:27:08Z) - Nonparametric Estimation of Heterogeneous Treatment Effects: From Theory
to Learning Algorithms [91.3755431537592]
プラグイン推定と擬似出力回帰に依存する4つの幅広いメタ学習戦略を解析する。
この理論的推論を用いて、アルゴリズム設計の原則を導出し、分析を実践に翻訳する方法について強調する。
論文 参考訳(メタデータ) (2021-01-26T17:11:40Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - Managing caching strategies for stream reasoning with reinforcement
learning [18.998260813058305]
ストリーム推論は、継続的なデータ変更よりも効率的な意思決定を可能にする。
我々は、衝突駆動制約学習(CDCL)を用いてレガシーソリューションを効率的に更新する新しいアプローチを提案する。
特に,強化学習の適用性について検討し,学習制約の有用性を継続的に評価する。
論文 参考訳(メタデータ) (2020-08-07T15:01:41Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。