論文の概要: The Application of Data Mining in the Production Processes
- arxiv url: http://arxiv.org/abs/2011.12348v1
- Date: Tue, 24 Nov 2020 20:00:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 14:29:56.025697
- Title: The Application of Data Mining in the Production Processes
- Title(参考訳): 生産プロセスにおけるデータマイニングの応用
- Authors: Hamza Saad
- Abstract要約: この研究は7つのアルゴリズムを用いて生産データを分析し、業界における最良の結果とアルゴリズムを抽出した。
決定木は製造データや生産データを扱うのに適したアルゴリズムであり、特にこのアルゴリズムは数値データや分類データを扱うことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional statistical and measurements are unable to solve all industrial
data in the right way and appropriate time. Open markets mean the customers are
increased, and production must increase to provide all customer requirements.
Nowadays, large data generated daily from different production processes and
traditional statistical or limited measurements are not enough to handle all
daily data. Improve production and quality need to analyze data and extract the
important information about the process how to improve. Data mining applied
successfully in the industrial processes and some algorithms such as mining
association rules, and decision tree recorded high professional results in
different industrial and production fields. The study applied seven algorithms
to analyze production data and extract the best result and algorithm in the
industry field. KNN, Tree, SVM, Random Forests, ANN, Na\"ive Bayes, and
AdaBoost applied to classify data based on three attributes without neglect any
variables whether this variable is numerical or categorical. The best results
of accuracy and area under the curve (ROC) obtained from Decision tree and its
ensemble algorithms (Random Forest and AdaBoost). Thus, a decision tree is an
appropriate algorithm to handle manufacturing and production data especially
this algorithm can handle numerical and categorical data.
- Abstract(参考訳): 従来の統計や測定では、すべての産業データを正しい方法で適切な時間で解決することはできない。
オープンマーケットは顧客の増加を意味し、すべての顧客要件を満たすために生産量を増やす必要がある。
今日では、異なる生産プロセスと従来の統計的または限られた測定結果から毎日発生する大きなデータは、すべての日次データを扱うには不十分である。
生産と品質を改善するには、データを分析し、プロセスに関する重要な情報を抽出する必要がある。
データマイニングは産業プロセスや鉱業組合規則などのアルゴリズムで成功し、意思決定木は工業と生産の異なる分野における高い専門的な成果を記録した。
この研究は7つのアルゴリズムを用いて生産データを分析し、業界における最良の結果とアルゴリズムを抽出した。
knn, tree, svm, random forests, ann, na\"ive bayes, adaboostは、この変数が数値かカテゴリかに関わらず、変数を無視せずに3つの属性に基づいてデータを分類するために適用される。
決定木とそのアンサンブルアルゴリズム(random forest and adaboost)から得られた曲線の精度と面積(roc)の最良の結果。
したがって、決定木は、特にこのアルゴリズムが数値的・カテゴリー的データを処理できる製造・生産データを扱うための適切なアルゴリズムである。
関連論文リスト
- Computation-Aware Gaussian Processes: Model Selection And Linear-Time Inference [55.150117654242706]
我々は、1.8万のデータポイントでトレーニングされた計算対応GPのモデル選択が、1つのGPU上で数時間以内に可能であることを示す。
この研究の結果、ガウス過程は、不確実性を定量化する能力を著しく妥協することなく、大規模なデータセットで訓練することができる。
論文 参考訳(メタデータ) (2024-11-01T21:11:48Z) - Dataset Growth [59.68869191071907]
InfoGrowthは、データのクリーニングとセレクションのための効率的なオンラインアルゴリズムである。
シングルモーダルタスクとマルチモーダルタスクの両方において、データ品質/効率を改善することができる。
論文 参考訳(メタデータ) (2024-05-28T16:43:57Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - $\texttt{causalAssembly}$: Generating Realistic Production Data for
Benchmarking Causal Discovery [1.3048920509133808]
我々は、因果探索手法のベンチマークをサポートする半合成製造データを生成するシステムを構築した。
我々は、柔軟に推定し、条件分布を表すために分布ランダムな森林を用いる。
このライブラリを用いて、よく知られた因果探索アルゴリズムをベンチマークする方法を示す。
論文 参考訳(メタデータ) (2023-06-19T10:05:54Z) - LAVA: Data Valuation without Pre-Specified Learning Algorithms [20.578106028270607]
我々は、下流学習アルゴリズムに不利な方法でトレーニングデータを評価できる新しいフレームワークを導入する。
本研究では,訓練と検証セット間の非伝統的なクラスワイドワッサースタイン距離に基づいて,トレーニングセットに関連する検証性能のプロキシを開発する。
距離は、特定のリプシッツ条件下での任意のモデルに対する検証性能の上限を特徴付けることを示す。
論文 参考訳(メタデータ) (2023-04-28T19:05:16Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Turkish Sentiment Analysis Using Machine Learning Methods: Application
on Online Food Order Site Reviews [0.0]
本研究は,Yemek Sepetiのデータを用いて,機械学習アルゴリズムの精度を最大化することを目的とする。
各アルゴリズムの精度は、使用する自然言語処理手法とともに算出された。
論文 参考訳(メタデータ) (2022-01-11T09:13:56Z) - Improving non-deterministic uncertainty modelling in Industry 4.0
scheduling [0.0]
本稿では,確率的不確実性モデリングによる非決定的不確実性を定量化する包括的手法を提案する。
結果はベルギーのフランダースにある産業データによって数値的に検証される。
論文 参考訳(メタデータ) (2021-01-08T23:17:55Z) - AI-based Modeling and Data-driven Evaluation for Smart Manufacturing
Processes [56.65379135797867]
本稿では,半導体製造プロセスに関する有用な知見を得るための動的アルゴリズムを提案する。
本稿では,遺伝的アルゴリズムとニューラルネットワークを利用して,知的特徴選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-29T14:57:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。