論文の概要: Estimating oil recovery factor using machine learning: Applications of
XGBoost classification
- arxiv url: http://arxiv.org/abs/2210.16345v1
- Date: Fri, 28 Oct 2022 18:21:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 15:30:07.766188
- Title: Estimating oil recovery factor using machine learning: Applications of
XGBoost classification
- Title(参考訳): 機械学習を用いたオイル回収係数の推定:XGBoost分類の適用
- Authors: Alireza Roustazadeh, Behzad Ghanbarian, Frank Male, Mohammad B.
Shadmand, Vahid Taslimitehrani, and Larry W. Lake
- Abstract要約: 石油工学では、極端回復因子であるRFを決定することが不可欠である。
そこで,本研究では,手軽に利用できる特徴を用いた機械学習(ML)を用いて,10種類の油圧RFを推定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In petroleum engineering, it is essential to determine the ultimate recovery
factor, RF, particularly before exploitation and exploration. However,
accurately estimating requires data that is not necessarily available or
measured at early stages of reservoir development. We, therefore, applied
machine learning (ML), using readily available features, to estimate oil RF for
ten classes defined in this study. To construct the ML models, we applied the
XGBoost classification algorithm. Classification was chosen because recovery
factor is bounded from 0 to 1, much like probability. Three databases were
merged, leaving us with four different combinations to first train and test the
ML models and then further evaluate them using an independent database
including unseen data. The cross-validation method with ten folds was applied
on the training datasets to assess the effectiveness of the models. To evaluate
the accuracy and reliability of the models, the accuracy, neighborhood
accuracy, and macro averaged f1 score were determined. Overall, results showed
that the XGBoost classification algorithm could estimate the RF class with
reasonable accuracies as high as 0.49 in the training datasets, 0.34 in the
testing datasets and 0.2 in the independent databases used. We found that the
reliability of the XGBoost model depended on the data in the training dataset
meaning that the ML models were database dependent. The feature importance
analysis and the SHAP approach showed that the most important features were
reserves and reservoir area and thickness.
- Abstract(参考訳): 石油工学では、特に搾取や探査前に究極の回復因子rfを決定することが不可欠である。
しかし、正確に推定するには貯水池開発の初期段階で必ずしも利用できないデータが必要である。
そこで,本研究では,手軽に利用できる特徴を用いた機械学習(ML)を用いて,10種類の油圧RFを推定する。
MLモデルを構築するために,XGBoost分類アルゴリズムを適用した。
分類は、確率と同様に、回復因子が0から1に境界があるため選択された。
3つのデータベースがマージされ、最初にMLモデルをトレーニングしてテストするために4つの異なる組み合わせが残されました。
モデルの有効性を評価するため,10倍のクロスバリデーション法をトレーニングデータセットに適用した。
モデルの精度と信頼性を評価するため, 精度, 近傍精度, マクロ平均f1スコアを測定した。
その結果、XGBoost分類アルゴリズムは、トレーニングデータセットで0.49、テストデータセットで0.34、使用する独立したデータベースで0.2の精度でRFクラスを推定できることがわかった。
XGBoostモデルの信頼性はトレーニングデータセットのデータに依存するため,MLモデルはデータベースに依存していることがわかった。
特徴量分析とshapアプローチにより,最も重要な特徴は貯留層と貯水池面積と厚さであった。
関連論文リスト
- What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - An Evaluation of Machine Learning Approaches for Early Diagnosis of
Autism Spectrum Disorder [0.0]
自閉症スペクトラム障害(Autistic Spectrum disorder、ASD)は、社会的相互作用、コミュニケーション、反復活動の困難を特徴とする神経疾患である。
本研究は,診断プロセスの強化と自動化を目的として,多様な機械学習手法を用いて重要なASD特性を同定する。
論文 参考訳(メタデータ) (2023-09-20T21:23:37Z) - Convolutional Neural Networks for the classification of glitches in
gravitational-wave data streams [52.77024349608834]
我々は、高度LIGO検出器のデータから過渡ノイズ信号(グリッチ)と重力波を分類する。
どちらも、Gravity Spyデータセットを使用して、スクラッチからトレーニングされた、教師付き学習アプローチのモデルを使用します。
また、擬似ラベルの自動生成による事前学習モデルの自己教師型アプローチについても検討する。
論文 参考訳(メタデータ) (2023-03-24T11:12:37Z) - Exploring the Value of Pre-trained Language Models for Clinical Named
Entity Recognition [6.917786124918387]
我々は、スクラッチからトレーニングされたTransformerモデルと、細調整されたBERTベースのLLMを比較した。
文脈学習を促進するために,追加のCRF層がそのようなモデルに与える影響を検討する。
論文 参考訳(メタデータ) (2022-10-23T16:27:31Z) - Estimating oil and gas recovery factors via machine learning:
Database-dependent accuracy and reliability [0.0]
重要な貯水池特性は炭化水素回収係数(RF)であり、その正確な推定は掘削と生産戦略に決定的な洞察を与える。
本研究の目的は,多孔性,透水性,圧力,飽和水などの種々の貯留層特性から,機械学習(ML)手法を用いて炭化水素のRFを推定することである。
論文 参考訳(メタデータ) (2022-10-22T16:25:49Z) - A Case Study on the Classification of Lost Circulation Events During
Drilling using Machine Learning Techniques on an Imbalanced Large Dataset [0.0]
イランのアザデガン油田から得られた65,000以上のデータと階級不均衡問題を利用する。
データセットの17のパラメータのうち11は、5つの失われた循環イベントの分類に使用される。
分類モデルを生成するために,6つの基本機械学習アルゴリズムと4つのアンサンブル学習手法を用いた。
論文 参考訳(メタデータ) (2022-09-04T12:28:40Z) - Learning brain MRI quality control: a multi-factorial generalization
problem [0.0]
本研究の目的は,MRIQCパイプラインの性能評価である。
分析はMRIQCの前処理ステップに焦点を合わせ、パイプラインをそれなしでテストした。
我々は、CATIデータセットのような異種集団のデータで訓練されたモデルが、目に見えないデータの最良のスコアを提供すると結論付けた。
論文 参考訳(メタデータ) (2022-05-31T15:46:44Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。