Fugu-MT 論文翻訳(概要): Learning Algorithms for Regenerative Stopping Problems with Applications to Shipping Consolidation in Logistics

論文の概要: Learning Algorithms for Regenerative Stopping Problems with Applications to Shipping Consolidation in Logistics

arxiv url: http://arxiv.org/abs/2105.02318v1
Date: Wed, 5 May 2021 20:45:46 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-07 13:20:50.601880
Title: Learning Algorithms for Regenerative Stopping Problems with Applications to Shipping Consolidation in Logistics
Title（参考訳）: 再生停止問題の学習アルゴリズムと物流における輸送統合への応用
Authors: Kishor Jothimurugan, Matthew Andrews, Jeongran Lee and Lorenzo Maggi
Abstract要約: 制御器が停止し、長期平均コストを最小限に抑えると、システムが再起動する再生停止問題について検討する。従来のモデルベースのソリューションは、推定モデルのためのデータとコンピューティング戦略から基礎となるプロセスを推定する。シミュレーションからニューラルネットワークのポリシーを学習する深層強化学習と模擬学習とを比較します。
参考スコア（独自算出の注目度）: 8.111251824291244
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study regenerative stopping problems in which the system starts anew whenever the controller decides to stop and the long-term average cost is to be minimized. Traditional model-based solutions involve estimating the underlying process from data and computing strategies for the estimated model. In this paper, we compare such solutions to deep reinforcement learning and imitation learning which involve learning a neural network policy from simulations. We evaluate the different approaches on a real-world problem of shipping consolidation in logistics and demonstrate that deep learning can be effectively used to solve such problems.
Abstract（参考訳）: 制御器が停止し、長期平均コストを最小限に抑えると、システムが再起動する再生停止問題について検討する。従来のモデルベースのソリューションは、推定モデルのためのデータとコンピューティング戦略から基礎となるプロセスを推定する。本稿では,シミュレーションからニューラルネットワークポリシーを学習する深層強化学習と模倣学習を比較した。我々は,ロジスティクスにおける出荷統合という現実世界の問題に対する異なるアプローチを評価し,これらの問題を解決するためにディープラーニングを効果的に活用できることを実証する。

関連論文リスト

Learning traffic flows: Graph Neural Networks for Metamodelling Traffic Assignment [1.078439500019266]
トラヒックアサインメント問題(Traffic Assignment Problem)は、特に大規模ネットワークにおいて、交通モデリングにおける基本的な作業である。従来の手法では、反復的なシミュレーションを平衡に到達させ、リアルタイムまたは大規模シナリオ分析を困難にしている。本稿では,ユーザ平衡割当の平衡フローを近似するメタモデルとして,メッセージパッシングニューラルネットワークを用いた学習に基づくアプローチを提案する。
論文参考訳（メタデータ） (2025-05-16T13:25:22Z)
Learning for Cross-Layer Resource Allocation in MEC-Aided Cell-Free Networks [71.30914500714262]
移動エッジコンピューティング(MEC)を援用したセルフリーネットワーク上でのクロスレイヤリソース割り当ては、データレートを促進するために、送信およびコンピューティングリソースを十分に活用することができる。深層学習の観点からMEC支援セルフリーネットワークのサブキャリア配置とビームフォーミング最適化について検討した。
論文参考訳（メタデータ） (2024-12-21T10:18:55Z)
A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文参考訳（メタデータ） (2024-09-18T14:57:13Z)
Model-Free Active Exploration in Reinforcement Learning [53.786439742572995]
強化学習における探索問題について検討し,新しいモデルフリーソリューションを提案する。我々の戦略は、最先端の探査アプローチよりも高速に効率的な政策を特定できる。
論文参考訳（メタデータ） (2024-06-30T19:00:49Z)
Liquid Neural Network-based Adaptive Learning vs. Incremental Learning for Link Load Prediction amid Concept Drift due to Network Failures [37.66676003679306]
概念の漂流に適応することは、機械学習において難しい課題である。通信ネットワークでは、障害イベントの後に交通予報を行う際にこのような問題が生じる。本稿では,適応学習アルゴリズム,すなわち,データパターンの急激な変化を,再学習を必要とせずに自己適応できる手法を提案する。
論文参考訳（メタデータ） (2024-04-08T08:47:46Z)
Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文参考訳（メタデータ） (2024-04-04T06:24:11Z)
Model-Based Reinforcement Learning Control of Reaction-Diffusion Problems [0.0]
強化学習はいくつかのアプリケーション、特にゲームにおいて意思決定に応用されている。輸送されたフィールドの流れを駆動する2つの新しい報酬関数を導入する。その結果、これらのアプリケーションで特定の制御をうまく実装できることが判明した。
論文参考訳（メタデータ） (2024-02-22T11:06:07Z)
On Task-Relevant Loss Functions in Meta-Reinforcement Learning and Online LQR [9.355903533901023]
本稿では,タスク指向方式でシステムや環境のモデルを学習する,サンプル効率のメタRLアルゴリズムを提案する。メタRLの標準的なモデルベースアプローチとは対照的に,本手法では,環境の決定クリティカルな部分を迅速に捉えるために,値情報を利用する。
論文参考訳（メタデータ） (2023-12-09T04:52:28Z)
Robust Deep Reinforcement Learning Scheduling via Weight Anchoring [7.570246812206769]
我々は、重みアンカーを用いてニューラルネットワークの望ましい振る舞いを培養し、固定する。ウェイトアンカーは、他の学習問題の解に近い学習問題の解を見つけるために用いられる。その結果,シミュレーション環境を増強する技術に匹敵する性能が得られた。
論文参考訳（メタデータ） (2023-04-20T09:30:23Z)
The least-control principle for learning at equilibrium [65.2998274413952]
我々は、平衡反復ニューラルネットワーク、深層平衡モデル、メタラーニングを学ぶための新しい原理を提案する。私たちの結果は、脳がどのように学習するかを明らかにし、幅広い機械学習問題にアプローチする新しい方法を提供します。
論文参考訳（メタデータ） (2022-07-04T11:27:08Z)
Nonparametric Estimation of Heterogeneous Treatment Effects: From Theory to Learning Algorithms [91.3755431537592]
プラグイン推定と擬似出力回帰に依存する4つの幅広いメタ学習戦略を解析する。この理論的推論を用いて、アルゴリズム設計の原則を導出し、分析を実践に翻訳する方法について強調する。
論文参考訳（メタデータ） (2021-01-26T17:11:40Z)
Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文参考訳（メタデータ） (2020-12-15T16:29:49Z)
Managing caching strategies for stream reasoning with reinforcement learning [18.998260813058305]
ストリーム推論は、継続的なデータ変更よりも効率的な意思決定を可能にする。我々は、衝突駆動制約学習(CDCL)を用いてレガシーソリューションを効率的に更新する新しいアプローチを提案する。特に,強化学習の適用性について検討し,学習制約の有用性を継続的に評価する。
論文参考訳（メタデータ） (2020-08-07T15:01:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。