論文の概要: A Feature Importance Analysis for Soft-Sensing-Based Predictions in a
Chemical Sulphonation Process
- arxiv url: http://arxiv.org/abs/2009.12133v1
- Date: Fri, 25 Sep 2020 11:20:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 23:23:58.113751
- Title: A Feature Importance Analysis for Soft-Sensing-Based Predictions in a
Chemical Sulphonation Process
- Title(参考訳): 化学合成プロセスにおけるソフトセンシングに基づく予測の重要度分析
- Authors: Enrique Garcia-Ceja, {\AA}smund Hugo, Brice Morin, Per-Olav Hansen,
Espen Martinsen, An Ngoc Lam, {\O}ystein Haugen
- Abstract要約: 我々は、関心の変数を直接感知するのではなく、他のプロセス変数に基づいて関心の変数を予測するソフトセンシングアプローチを用いる。
本研究の目的は,どの変数が製品品質の予測に最も関連があるか,どの精度でどの変数が正しいかを探索し,検出することであった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we present the results of a feature importance analysis of a
chemical sulphonation process. The task consists of predicting the
neutralization number (NT), which is a metric that characterizes the product
quality of active detergents. The prediction is based on a dataset of
environmental measurements, sampled from an industrial chemical process. We
used a soft-sensing approach, that is, predicting a variable of interest based
on other process variables, instead of directly sensing the variable of
interest. Reasons for doing so range from expensive sensory hardware to harsh
environments, e.g., inside a chemical reactor. The aim of this study was to
explore and detect which variables are the most relevant for predicting product
quality, and to what degree of precision. We trained regression models based on
linear regression, regression tree and random forest. A random forest model was
used to rank the predictor variables by importance. Then, we trained the models
in a forward-selection style by adding one feature at a time, starting with the
most important one. Our results show that it is sufficient to use the top 3
important variables, out of the 8 variables, to achieve satisfactory prediction
results. On the other hand, Random Forest obtained the best result when trained
with all variables.
- Abstract(参考訳): 本稿では,化学吸音プロセスの特徴的重要性分析の結果について述べる。
このタスクは、活性洗剤の製品品質を特徴づける指標である中性化数(NT)を予測することで構成される。
この予測は、産業化学プロセスから採取された環境測定のデータセットに基づいている。
我々は、関心の変数を直接感知するのではなく、他のプロセス変数に基づいて関心の変数を予測するソフトセンシングアプローチを用いた。
その理由は、高価なセンサーハードウェアから化学反応器内の厳しい環境まで様々である。
本研究の目的は,どの変数が製品品質の予測に最も関連があるか,どの程度の精度で調べ,検出することであった。
線形回帰,回帰木,ランダムフォレストに基づく回帰モデルを訓練した。
ランダム森林モデルを用いて予測変数を重要度でランク付けした。
次に、最も重要なものから始めて、1度に1つの機能を追加することで、前方選択スタイルでモデルをトレーニングしました。
その結果,8変数のうち上位3変数を有効活用して,良好な予測結果が得られることがわかった。
一方、ランダムフォレストでは、すべての変数のトレーニングで最高の結果を得た。
関連論文リスト
- Enhancing Variable Importance in Random Forests: A Novel Application of Global Sensitivity Analysis [0.9954382983583578]
本研究は,Global Sensitivity Analysisをランダムフォレストなどの教師あり機械学習手法に適用する。
グローバル感度解析は、入力変数の不確かさが出力に与える影響を調べるために主に数学的モデリングで用いられる。
シミュレーション研究により,提案手法は,効率,説明能力,あるいは既存の結果の確認方法によって,どのような進歩が達成できるかを探索するために有効であることが示唆された。
論文 参考訳(メタデータ) (2024-07-19T10:45:36Z) - Applying ranking techniques for estimating influence of Earth variables
on temperature forecast error [0.6144680854063939]
本稿では,地球系の変数が温度予測を行う際の誤差に与える影響を解析する方法について述べる。
主なコントリビューションは、相関関係をランキングに変換し、それらを総合的なランキングに組み合わせる方法を示すフレームワークである。
我々は,このランク付け手法の挙動を解析するために,選択した5つの場所で実験を行った。
論文 参考訳(メタデータ) (2024-03-12T12:59:00Z) - A Notion of Feature Importance by Decorrelation and Detection of Trends
by Random Forest Regression [1.675857332621569]
本稿では,よく研究されたGram-Schmidt decorrelation法に基づく特徴重要度の概念を導入する。
本研究では,ランダムな森林回帰を用いてデータ中の傾向を推定する2つの推定手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T11:01:49Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z) - Variance Minimization in the Wasserstein Space for Invariant Causal
Prediction [72.13445677280792]
そこで本研究では,ICPで行ったアプローチを,予測器数で線形にスケールする一連の非パラメトリックテストとして再検討する。
これらのテストはそれぞれ、最適輸送理論の道具から導かれる新しい損失関数の最小化に依存している。
我々は,本手法が同定可能な直接原因の集合を回復できるという軽微な仮定の下で証明し,他のベンチマーク因果探索アルゴリズムと競合することを示す。
論文 参考訳(メタデータ) (2021-10-13T22:30:47Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Achieving Reliable Causal Inference with Data-Mined Variables: A Random
Forest Approach to the Measurement Error Problem [1.5749416770494704]
一般的な実証的戦略は、利用可能なデータから関心のある変数を'マイニング'する予測モデリング手法の適用を含む。
最近の研究は、機械学習モデルからの予測は必然的に不完全であるため、予測変数に基づく計量分析は測定誤差によるバイアスに悩まされる可能性が高いことを強調している。
ランダムフォレストと呼ばれるアンサンブル学習技術を用いて,これらのバイアスを軽減する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-12-19T21:48:23Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。