論文の概要: A Case Study on the Classification of Lost Circulation Events During
Drilling using Machine Learning Techniques on an Imbalanced Large Dataset
- arxiv url: http://arxiv.org/abs/2209.01607v2
- Date: Wed, 7 Sep 2022 16:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-08 11:56:48.148184
- Title: A Case Study on the Classification of Lost Circulation Events During
Drilling using Machine Learning Techniques on an Imbalanced Large Dataset
- Title(参考訳): 不均衡大規模データセット上での機械学習手法を用いた掘削作業中の損失循環事象の分類に関する事例研究
- Authors: Toluwalase A. Olukoga, Yin Feng
- Abstract要約: イランのアザデガン油田から得られた65,000以上のデータと階級不均衡問題を利用する。
データセットの17のパラメータのうち11は、5つの失われた循環イベントの分類に使用される。
分類モデルを生成するために,6つの基本機械学習アルゴリズムと4つのアンサンブル学習手法を用いた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study presents machine learning models that forecast and categorize lost
circulation severity preemptively using a large class imbalanced drilling
dataset. We demonstrate reproducible core techniques involved in tackling a
large drilling engineering challenge utilizing easily interpretable machine
learning approaches.
We utilized a 65,000+ records data with class imbalance problem from Azadegan
oilfield formations in Iran. Eleven of the dataset's seventeen parameters are
chosen to be used in the classification of five lost circulation events. To
generate classification models, we used six basic machine learning algorithms
and four ensemble learning methods. Linear Discriminant Analysis (LDA),
Logistic Regression (LR), Support Vector Machines (SVM), Classification and
Regression Trees (CART), k-Nearest Neighbors (KNN), and Gaussian Naive Bayes
(GNB) are the six fundamental techniques. We also used bagging and boosting
ensemble learning techniques in the investigation of solutions for improved
predicting performance. The performance of these algorithms is measured using
four metrics: accuracy, precision, recall, and F1-score. The F1-score weighted
to represent the data imbalance is chosen as the preferred evaluation
criterion.
The CART model was found to be the best in class for identifying drilling
fluid circulation loss events with an average weighted F1-score of 0.9904 and
standard deviation of 0.0015. Upon application of ensemble learning techniques,
a Random Forest ensemble of decision trees showed the best predictive
performance. It identified and classified lost circulation events with a
perfect weighted F1-score of 1.0. Using Permutation Feature Importance (PFI),
the measured depth was found to be the most influential factor in accurately
recognizing lost circulation events while drilling.
- Abstract(参考訳): 本研究では,大規模不均衡掘削データセットを用いて,損失循環量の予測と分類を行う機械学習モデルを提案する。
我々は,容易に解釈可能な機械学習手法を用いて,大規模な掘削エンジニアリング課題に取り組むための再現可能なコア技術を示す。
イランのアザデガン油田層からのクラス不均衡問題を伴う65,000以上の記録データを用いた。
データセットの17のパラメータのうち11は、5つの失われた循環イベントの分類に使用される。
分類モデルの生成には,6つの基本機械学習アルゴリズムと4つのアンサンブル学習手法を用いた。
リニア識別分析(LDA)、ロジスティック回帰(LR)、サポートベクトルマシン(SVM)、分類と回帰木(CART)、k-Nearest Neighbors(KNN)、ガウスネーブベイズ(GNB)は6つの基本技術である。
また,ベイジングとアンサンブル学習を併用し,予測性能向上のための解の探索を行った。
これらのアルゴリズムの性能は、精度、精度、リコール、F1スコアの4つの指標を用いて測定される。
好ましい評価基準として、データ不均衡を表す重み付きF1スコアを選択する。
カート模型は, 平均重み付きf1-score 0.9904, 標準偏差 0.0015 の掘削流体循環損失の同定に最適であることが判明した。
アンサンブル学習手法を適用すると、決定木からなるランダムフォレストアンサンブルが最高の予測性能を示した。
完全重み付きF1スコア1.0の損失循環イベントを特定し、分類した。
また, PFI(Permutation Feature Importance)を用いて, 掘削中に消失した循環イベントを正確に認識する上で, 測定深度が最も重要な要因であることがわかった。
関連論文リスト
- Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - A comparative study on machine learning approaches for rock mass classification using drilling data [0.3749861135832073]
掘削・爆発トンネルにおける現在の岩石工学設計は、技術者の観察的評価に依存している。
トンネル掘削時に収集した高分解能センサ・データセットであるMWDデータ(MWD)は未利用である。
本研究の目的は,MWDデータを岩盤工学の実用的な指標に自動変換することである。
論文 参考訳(メタデータ) (2024-03-15T15:37:19Z) - Efficient Grammatical Error Correction Via Multi-Task Training and
Optimized Training Schedule [55.08778142798106]
原文と修正文のアライメントを利用する補助タスクを提案する。
我々は,各タスクをシーケンス・ツー・シーケンス問題として定式化し,マルチタスク・トレーニングを行う。
トレーニングに使用されるデータセットの順序や、データセット内の個々のインスタンスでさえ、最終的なパフォーマンスに重要な影響を与える可能性があることが分かりました。
論文 参考訳(メタデータ) (2023-11-20T14:50:12Z) - Blending gradient boosted trees and neural networks for point and
probabilistic forecasting of hierarchical time series [0.0]
本稿では、勾配木やニューラルネットワークファミリーに属する機械学習モデルのブレンディング手法について述べる。
これらの原則は、最近のM5コンペティションにおいて、正確性と不確実性の両方のトラックでうまく適用された。
論文 参考訳(メタデータ) (2023-10-19T09:42:02Z) - Convolutional Neural Networks for the classification of glitches in
gravitational-wave data streams [52.77024349608834]
我々は、高度LIGO検出器のデータから過渡ノイズ信号(グリッチ)と重力波を分類する。
どちらも、Gravity Spyデータセットを使用して、スクラッチからトレーニングされた、教師付き学習アプローチのモデルを使用します。
また、擬似ラベルの自動生成による事前学習モデルの自己教師型アプローチについても検討する。
論文 参考訳(メタデータ) (2023-03-24T11:12:37Z) - Estimating oil recovery factor using machine learning: Applications of
XGBoost classification [0.0]
石油工学では、極端回復因子であるRFを決定することが不可欠である。
そこで,本研究では,手軽に利用できる特徴を用いた機械学習(ML)を用いて,10種類の油圧RFを推定する。
論文 参考訳(メタデータ) (2022-10-28T18:21:25Z) - Fraud Detection Using Optimized Machine Learning Tools Under Imbalance
Classes [0.304585143845864]
機械学習(ML)ツールのスマートバージョンによる不正検出は、安全性を保証するために不可欠である。
本稿では,4つの最先端ML手法,すなわちロジスティック回帰,決定木,ランダム森林,極端な勾配上昇について検討する。
フィッシングサイトURLとクレジットカード不正取引データセットは、元のデータに基づいてトレーニングされた極端な勾配が、信頼できるパフォーマンスを示していることを示している。
論文 参考訳(メタデータ) (2022-09-04T15:30:23Z) - Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A
Frequentest and Machine Learning based Stacking Framework [0.803552105641624]
本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。
Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と機械学習技術の3つの状態(決定木、ランダム森林、勾配上昇)と比較される。
論文 参考訳(メタデータ) (2022-07-21T19:15:53Z) - Continual Learning For On-Device Environmental Sound Classification [63.81276321857279]
デバイス上での環境音の分類のための簡易かつ効率的な連続学習法を提案する。
本手法は,サンプルごとの分類の不確実性を測定することにより,トレーニングの履歴データを選択する。
論文 参考訳(メタデータ) (2022-07-15T12:13:04Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Provable tradeoffs in adversarially robust classification [96.48180210364893]
我々は、ロバストなイソペリメトリに関する確率論の最近のブレークスルーを含む、新しいツールを開発し、活用する。
この結果から,データの不均衡時に増加する標準精度とロバスト精度の基本的なトレードオフが明らかになった。
論文 参考訳(メタデータ) (2020-06-09T09:58:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。