論文の概要: Data science on industrial data -- Today's challenges in brown field
applications
- arxiv url: http://arxiv.org/abs/2006.05757v1
- Date: Wed, 10 Jun 2020 10:05:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 06:34:29.562447
- Title: Data science on industrial data -- Today's challenges in brown field
applications
- Title(参考訳): 産業データに関するデータサイエンス --ブラウンフィールド応用における今日の課題-
- Authors: Tilman Klaeger, Sebastian Gottschall, Lukas Oehm
- Abstract要約: 本論文は,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。
この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。
機械学習アプリケーションのデータ品質は、実験室を去ると問題になる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Much research is done on data analytics and machine learning. In industrial
processes large amounts of data are available and many researchers are trying
to work with this data. In practical approaches one finds many pitfalls
restraining the application of modern technologies especially in brown field
applications. With this paper we want to show state of the art and what to
expect when working with stock machines in the field. A major focus in this
paper is on data collection which can be more cumbersome than most people might
expect. Also data quality for machine learning applications is a challenge once
leaving the laboratory. In this area one has to expect the lack of semantic
description of the data as well as very little ground truth being available for
training and verification of machine learning models. A last challenge is IT
security and passing data through firewalls.
- Abstract(参考訳): 多くの研究がデータ分析と機械学習で行われている。
産業プロセスでは大量のデータが利用可能であり、多くの研究者がこのデータに取り組んでいる。
実践的なアプローチでは、現代の技術、特にブラウンフィールド応用の適用を阻害する多くの落とし穴が見つかる。
本論文では,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。
この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。
また、機械学習アプリケーションのデータ品質も実験室を去ると課題となる。
この領域では、データのセマンティックな記述の欠如と、マシンラーニングモデルのトレーニングと検証に利用できる基礎的な真実の欠如を期待する必要があります。
最後の課題はITセキュリティとファイアウォールへのデータ転送です。
関連論文リスト
- IPAD: Industrial Process Anomaly Detection Dataset [71.39058003212614]
ビデオ異常検出(VAD)は,ビデオフレーム内の異常を認識することを目的とした課題である。
本稿では,産業シナリオにおけるVADに特化して設計された新しいデータセットIPADを提案する。
このデータセットは16の異なる産業用デバイスをカバーし、合成ビデオと実世界のビデオの両方を6時間以上保存している。
論文 参考訳(メタデータ) (2024-04-23T13:38:01Z) - The Frontier of Data Erasure: Machine Unlearning for Large Language Models [56.26002631481726]
大規模言語モデル(LLM)はAIの進歩の基礎となっている。
LLMは機密情報、偏見情報、著作権情報を記憶し、広めることによってリスクを生じさせる。
機械学習は、これらの懸念を軽減するための最先端のソリューションとして現れます。
論文 参考訳(メタデータ) (2024-03-23T09:26:15Z) - Cheap Learning: Maximising Performance of Language Models for Social
Data Science Using Minimal Data [1.8692054990918079]
近年発展してきた3つの安価な技術について概観する。
後者では、大規模言語モデルのゼロショットプロンプトの特定の事例について概観する。
我々は,すべての技術に対して優れた性能を示し,特に大規模言語モデルのプロンプトが,非常に低コストで高い精度を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-22T19:00:11Z) - How to Do Machine Learning with Small Data? -- A Review from an
Industrial Perspective [1.443696537295348]
著者らは、"小さなデータ"の一般的な用語とそのエンジニアリングと産業アプリケーションの役割を解釈することに重点を置いている。
小さなデータはビッグデータと比較して様々な特性で定義され、機械学習形式が導入された。
産業アプリケーションにおける小さなデータによる機械学習の5つの重要な課題を提示する。
論文 参考訳(メタデータ) (2023-11-13T07:39:13Z) - Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow [49.724842920942024]
金融、気象学、エネルギーといった産業は毎日大量のデータを生み出している。
本研究では,データ分析エージェントであるData-Copilotを提案する。
論文 参考訳(メタデータ) (2023-06-12T16:12:56Z) - KGLiDS: A Platform for Semantic Abstraction, Linking, and Automation of Data Science [4.120803087965204]
本稿では、機械学習と知識グラフ技術を用いて、データサイエンスアーティファクトのセマンティクスとその接続を抽象化し、キャプチャするスケーラブルなプラットフォームKGLiDSを提案する。
この情報に基づいて、KGLiDSはデータディスカバリやパイプライン自動化など、さまざまなダウンストリームアプリケーションを可能にする。
論文 参考訳(メタデータ) (2023-03-03T20:31:04Z) - A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。
MLモデルは古いデータをよく記憶します。
機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文 参考訳(メタデータ) (2022-09-06T08:51:53Z) - Maximizing information from chemical engineering data sets: Applications
to machine learning [61.442473332320176]
化学工学の応用において、古典的な人工知能のアプローチを適用するのが難しくなる4つの特徴を同定する。
それぞれのデータ特性について、これらのデータ特性が生じるアプリケーションについて論じ、現在の化学工学研究が、これらの課題を組み込むために、データサイエンスと機械学習の分野をどのように拡張しているかを示す。
論文 参考訳(メタデータ) (2022-01-25T01:25:45Z) - Data Collection and Quality Challenges in Deep Learning: A Data-Centric
AI Perspective [16.480530590466472]
データ中心のAIプラクティスが主流になりつつある。
現実世界の多くのデータセットは小さく、汚く、偏りがあり、毒まみれである。
データ品質については、データ検証とデータクリーニング技術について研究する。
論文 参考訳(メタデータ) (2021-12-13T03:57:36Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。