論文の概要: Data science on industrial data -- Today's challenges in brown field
applications
- arxiv url: http://arxiv.org/abs/2006.05757v1
- Date: Wed, 10 Jun 2020 10:05:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 06:34:29.562447
- Title: Data science on industrial data -- Today's challenges in brown field
applications
- Title(参考訳): 産業データに関するデータサイエンス --ブラウンフィールド応用における今日の課題-
- Authors: Tilman Klaeger, Sebastian Gottschall, Lukas Oehm
- Abstract要約: 本論文は,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。
この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。
機械学習アプリケーションのデータ品質は、実験室を去ると問題になる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Much research is done on data analytics and machine learning. In industrial
processes large amounts of data are available and many researchers are trying
to work with this data. In practical approaches one finds many pitfalls
restraining the application of modern technologies especially in brown field
applications. With this paper we want to show state of the art and what to
expect when working with stock machines in the field. A major focus in this
paper is on data collection which can be more cumbersome than most people might
expect. Also data quality for machine learning applications is a challenge once
leaving the laboratory. In this area one has to expect the lack of semantic
description of the data as well as very little ground truth being available for
training and verification of machine learning models. A last challenge is IT
security and passing data through firewalls.
- Abstract(参考訳): 多くの研究がデータ分析と機械学習で行われている。
産業プロセスでは大量のデータが利用可能であり、多くの研究者がこのデータに取り組んでいる。
実践的なアプローチでは、現代の技術、特にブラウンフィールド応用の適用を阻害する多くの落とし穴が見つかる。
本論文では,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。
この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。
また、機械学習アプリケーションのデータ品質も実験室を去ると課題となる。
この領域では、データのセマンティックな記述の欠如と、マシンラーニングモデルのトレーニングと検証に利用できる基礎的な真実の欠如を期待する必要があります。
最後の課題はITセキュリティとファイアウォールへのデータ転送です。
関連論文リスト
- Cheap Learning: Maximising Performance of Language Models for Social
Data Science Using Minimal Data [1.8692054990918079]
近年発展してきた3つの安価な技術について概観する。
後者では、大規模言語モデルのゼロショットプロンプトの特定の事例について概観する。
我々は,すべての技術に対して優れた性能を示し,特に大規模言語モデルのプロンプトが,非常に低コストで高い精度を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-22T19:00:11Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - How to Do Machine Learning with Small Data? -- A Review from an
Industrial Perspective [1.443696537295348]
著者らは、"小さなデータ"の一般的な用語とそのエンジニアリングと産業アプリケーションの役割を解釈することに重点を置いている。
小さなデータはビッグデータと比較して様々な特性で定義され、機械学習形式が導入された。
産業アプリケーションにおける小さなデータによる機械学習の5つの重要な課題を提示する。
論文 参考訳(メタデータ) (2023-11-13T07:39:13Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z) - Maximizing information from chemical engineering data sets: Applications
to machine learning [61.442473332320176]
化学工学の応用において、古典的な人工知能のアプローチを適用するのが難しくなる4つの特徴を同定する。
それぞれのデータ特性について、これらのデータ特性が生じるアプリケーションについて論じ、現在の化学工学研究が、これらの課題を組み込むために、データサイエンスと機械学習の分野をどのように拡張しているかを示す。
論文 参考訳(メタデータ) (2022-01-25T01:25:45Z) - Data Collection and Quality Challenges in Deep Learning: A Data-Centric
AI Perspective [16.480530590466472]
データ中心のAIプラクティスが主流になりつつある。
現実世界の多くのデータセットは小さく、汚く、偏りがあり、毒まみれである。
データ品質については、データ検証とデータクリーニング技術について研究する。
論文 参考訳(メタデータ) (2021-12-13T03:57:36Z) - Understanding and Preparing Data of Industrial Processes for Machine
Learning Applications [0.0]
本稿では, 非線形生産ラインの異なる生産ユニットにおけるセンサの非有効性に起因する, 欠落値の問題に対処する。
データのごく一部が欠落している場合、これらの欠落した値はしばしば暗示される。
本稿では,大量の観測データを除去することなく,利用可能なすべてのデータを活用できる手法を提案する。
論文 参考訳(メタデータ) (2021-09-08T07:39:11Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Scaling Systematic Literature Reviews with Machine Learning Pipelines [57.82662094602138]
体系的なレビューは、科学的文書からデータを抽出する。
これらの側面をそれぞれ自動化するパイプラインを構築し、多くの人間時間対システム品質トレードオフを実験します。
人間の専門的アノテーションの2週間だけで、パイプラインシステム全体の驚くほどの精度と一般性が得られることが分かりました。
論文 参考訳(メタデータ) (2020-10-09T16:19:42Z) - Data-Driven Aerospace Engineering: Reframing the Industry with Machine
Learning [49.367020832638794]
航空宇宙産業は、ビッグデータと機械学習を収益化しようとしている。
最近のトレンドは、設計、製造、検証、サービスにおける重要な課題の文脈で検討される。
論文 参考訳(メタデータ) (2020-08-24T22:40:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。