論文の概要: Adaptive mine planning under geological uncertainty: A POMDP framework for sequential decision-making
- arxiv url: http://arxiv.org/abs/2605.13702v1
- Date: Wed, 13 May 2026 15:52:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:28.156525
- Title: Adaptive mine planning under geological uncertainty: A POMDP framework for sequential decision-making
- Title(参考訳): 地質不確実性下におけるアダプティブ・マイニング・プランニング : シーケンシャル意思決定のためのPOMDPフレームワーク
- Authors: Hamza Khalifi, Jef Caers, Yassine Taha, Mostafa Benzaazoua, Abdellatif Elghali,
- Abstract要約: 部分観測可能なマルコフ決定過程(POMDP)としての地雷スケジューリングの定式化
擬似アニーリング(SA)値近似とアンサンブルに基づく信念更新を組み合わせたハイブリッドSA-POMDPアーキテクチャを提案する。
複数の処理先を持つ銅めっきオープンピットマイニング施設におけるフレームワークの評価を行った。
- 参考スコア(独自算出の注目度): 0.13048920509133807
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Strategic mine production scheduling under geological uncertainty is conventionally formulated as a stochastic optimization problem in which a fixed extraction sequence and routing decisions are computed ex ante. This plan-driven paradigm treats uncertainty as passive: decisions are hedged across geological scenarios, but planning does not anticipate how future observations will inform future decisions. We propose a different perspective by formulating mine scheduling as a Partially Observable Markov Decision Process (POMDP), in which extraction and routing decisions are made sequentially with planning explicitly integrating the expectation of future belief updates. To achieve computational tractability, we introduce a hybrid SA-POMDP architecture that combines simulated annealing-based (SA) value approximation with ensemble-based belief updating via ensemble smoother with multiple data assimilation (ES-MDA). At each decision epoch, candidate actions are evaluated through their expected long-term value under the current belief, and the belief is updated as mining observations are assimilated. This yields an adaptive policy rather than a fixed plan. We evaluate the framework on a copper-gold open-pit mining complex with multiple processing destinations. Under a statistically consistent prior, the SA-POMDP reduces the expectation-reality gap from 22.3% to 4.6%, improving realized NPV by USD8.4M relative to one-shot stochastic optimization. Under systematic prior misspecification of 10%, the adaptive framework outperforms static planning by up to USD44.6M (36.9%), demonstrating structural robustness beyond scenario hedging. These results show that sequential belief updating transforms geological uncertainty from a passive constraint into an active component of value creation.
- Abstract(参考訳): 地質的な不確実性の下での戦略的鉱山生産スケジューリングは、従来、固定された抽出シーケンスとルーティング決定をエクアンテで計算する確率最適化問題として定式化されてきた。
この計画駆動のパラダイムは不確実性を受動的として扱う:決定は地質学的シナリオにまたがるが、将来の観測が将来の決定にどのような影響を及ぼすかは予測していない。
本稿では,マイニングスケジューリングを部分観測可能なマルコフ決定プロセス (POMDP) として定式化し,抽出とルーティングの決定を順次行うとともに,今後の信条更新の期待を明示的に統合する計画を立てる。
計算的トラクタビリティを実現するために,シミュレートされたアニーリング(SA)値近似とアンサンブルに基づく信念更新を,複数のデータ同化(ES-MDA)と組み合わせたハイブリッドSA-POMDPアーキテクチャを導入する。
各決定時期において、現在の信念の下で予測される長期的価値を通じて候補行動を評価し、鉱山観測が同化されるにつれて、その信念を更新する。
これは固定的な計画よりも適応的な政策をもたらす。
複数の処理先を持つ銅めっきオープンピットマイニング施設におけるフレームワークの評価を行った。
統計的に一貫した事前条件の下で、SA-POMDPは期待と現実のギャップを22.3%から4.6%に減らし、1ショット確率最適化に対してUSD8.4Mにより実現されたNPVを改善した。
10%の体系的な事前特定の下では、適応的なフレームワークは、シナリオヘッジを超える構造的堅牢性を示すUSD44.6M (36.9%) の静的計画よりも優れていた。
これらの結果は、逐次的信念更新は、受動的制約から価値創造の活発な構成要素へと、地質的不確実性を変換することを示している。
関連論文リスト
- LeapTS: Rethinking Time Series Forecasting as Adaptive Multi-Horizon Scheduling [74.94985663101906]
本稿では,予測地平線上での動的スケジューリングプロセスとして時系列予測を再構成する新しいフレームワーク LeapTSを提案する。
LeapTSは、Transformerベースのモデルよりも2.6$times$から5.3$times$推論スピードアップを実現しつつ、全体的な予測性能を少なくとも7.4%向上させる。
論文 参考訳(メタデータ) (2026-05-11T09:54:02Z) - Deep Learning Decision Support System for Open-Pit Mining Optimisation: GPU-Accelerated Planning Under Geological Uncertainty [0.7310043452300737]
本研究では,長期露天採掘計画のための完全不確実性を考慮した最適化フレームワークを提案する。
地質的な不確実性は、5万の空間グレードのサンプルに基づいて訓練された変分オートエンコーダを用いてモデル化される。
その結果、IBM CPLEXよりも120万倍改善され、地質的な不確実性の下では予測されるNPVが大幅に向上した。
論文 参考訳(メタデータ) (2025-11-23T05:27:04Z) - Reinforcement Learning from Probabilistic Forecasts for Safe Decision-Making via Conditional Value-at-Risk Planning [41.52380204321823]
本稿では,ベイズ予測,後方サンプリング強化学習,計画とを結合した統一的枠組みである不確実性認識マルコフ決定プロセス(UAMDP)を提案する。
構造的不確実性と経済のボラティリティを特徴とする2つのドメインの高頻度株式取引と小売在庫管理において,UAMDPを評価した。
論文 参考訳(メタデータ) (2025-10-09T13:46:32Z) - Efficient Learning of POMDPs with Known Observation Model in Average-Reward Setting [56.92178753201331]
我々は,POMDPパラメータを信念に基づくポリシを用いて収集したサンプルから学習することのできる観測・認識スペクトル(OAS)推定手法を提案する。
提案するOAS-UCRLアルゴリズムに対して,OASプロシージャの整合性を示し,$mathcalO(sqrtT log(T)$の残差保証を証明した。
論文 参考訳(メタデータ) (2024-10-02T08:46:34Z) - Weathering Ongoing Uncertainty: Learning and Planning in a Time-Varying
Partially Observable Environment [14.646280719661465]
時間による環境変動は、システムの最適な意思決定戦略に大きな影響を及ぼす可能性がある。
本稿では,TV-POMDP内での正確な推定と計画を行うための2段階のアプローチを提案する。
提案するフレームワークとアルゴリズムをシミュレーションとロボットを用いて検証する。
論文 参考訳(メタデータ) (2023-12-06T03:20:42Z) - Robust and Adaptive Temporal-Difference Learning Using An Ensemble of
Gaussian Processes [70.80716221080118]
本稿では、時間差学習(TD)による政策評価の世代的視点について考察する。
OS-GPTDアプローチは、状態-逆ペアのシーケンスを観測することにより、与えられたポリシーの値関数を推定するために開発された。
1つの固定カーネルに関連する限られた表現性を緩和するために、GP前の重み付けアンサンブル(E)を用いて代替のスキームを生成する。
論文 参考訳(メタデータ) (2021-12-01T23:15:09Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - Learning Interpretable Deep State Space Model for Probabilistic Time
Series Forecasting [98.57851612518758]
確率的時系列予測は、その歴史に基づいて将来の分布を推定する。
本稿では,非線形エミッションモデルと遷移モデルとをネットワークによってパラメータ化した,確率的時系列予測のための深部状態空間モデルを提案する。
実験では,我々のモデルが正確かつ鋭い確率予測を生成することを示す。
論文 参考訳(メタデータ) (2021-01-31T06:49:33Z) - Identification of Unexpected Decisions in Partially Observable
Monte-Carlo Planning: a Rule-Based Approach [78.05638156687343]
本稿では,POMCPポリシーをトレースを検査して分析する手法を提案する。
提案手法は, 政策行動の局所的特性を探索し, 予期せぬ決定を識別する。
我々は,POMDPの標準ベンチマークであるTigerに対するアプローチと,移動ロボットナビゲーションに関する現実の問題を評価した。
論文 参考訳(メタデータ) (2020-12-23T15:09:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。