論文の概要: Ensuring the Robustness and Reliability of Data-Driven Knowledge
Discovery Models in Production and Manufacturing
- arxiv url: http://arxiv.org/abs/2007.14791v1
- Date: Tue, 28 Jul 2020 14:21:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 01:53:20.224686
- Title: Ensuring the Robustness and Reliability of Data-Driven Knowledge
Discovery Models in Production and Manufacturing
- Title(参考訳): 生産・製造におけるデータ駆動型知識発見モデルの堅牢性と信頼性の確保
- Authors: Shailesh Tripathi, David Muhr, Brunner Manuel, Frank Emmert-Streib,
Herbert Jodlbauer, and Matthias Dehmer
- Abstract要約: データマイニングのクロス産業標準プロセス(CRISP-DM)は、データおよびモデル関連の問題に対処するために設計された。
本稿では、CRISP-DMモデルの拡張と、機械学習における各種データロバストネスおよびモデル-ロバストネス関連問題について概説する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The implementation of robust, stable, and user-centered data analytics and
machine learning models is confronted by numerous challenges in production and
manufacturing. Therefore, a systematic approach is required to develop,
evaluate, and deploy such models. The data-driven knowledge discovery framework
provides an orderly partition of the data-mining processes to ensure the
practical implementation of data analytics and machine learning models.
However, the practical application of robust industry-specific data-driven
knowledge discovery models faces multiple data-- and model-development--related
issues. These issues should be carefully addressed by allowing a flexible,
customized, and industry-specific knowledge discovery framework; in our case,
this takes the form of the cross-industry standard process for data mining
(CRISP-DM). This framework is designed to ensure active cooperation between
different phases to adequately address data- and model-related issues. In this
paper, we review several extensions of CRISP-DM models and various
data-robustness-- and model-robustness--related problems in machine learning,
which currently lacks proper cooperation between data experts and business
experts because of the limitations of data-driven knowledge discovery models.
- Abstract(参考訳): 堅牢で安定した、ユーザ中心のデータ分析と機械学習モデルの実装は、生産と製造における多くの課題に直面している。
したがって、そのようなモデルを開発、評価、展開するには体系的なアプローチが必要である。
データ駆動知識発見フレームワークは、データ分析と機械学習モデルの実用的な実装を保証するために、データマイニングプロセスの秩序ある分割を提供する。
しかしながら、堅牢な業界固有のデータ駆動知識発見モデルの実用的応用は、複数のデータ開発とモデル開発に関連する問題に直面している。
これらの問題は、フレキシブルで、カスタマイズされ、業界固有の知識発見フレームワークを提供することで、慎重に対処する必要があります。
このフレームワークは、データおよびモデル関連の問題に適切に対処するために、異なるフェーズ間のアクティブな協調を保証するように設計されている。
本稿では,データ駆動型知識発見モデルの限界により,現在データ専門家とビジネスエキスパートの適切な連携が欠如している機械学習における,split-dmモデルとさまざまなデータロバスト性問題の拡張について概説する。
関連論文リスト
- TSPP: A Unified Benchmarking Tool for Time-series Forecasting [3.5415344166235534]
本稿では,時系列予測モデルの開発に係わる重要なモデリングと機械学習の決定を明らかにする,統一的なベンチマークフレームワークを提案する。
このフレームワークは、モデルとデータセットのシームレスな統合を促進し、実践者と研究者の両方が開発作業を支援する。
このフレームワーク内で最近提案されたモデルをベンチマークし、最小限の努力で注意深く実装されたディープラーニングモデルは、勾配決定木に匹敵する可能性があることを実証した。
論文 参考訳(メタデータ) (2023-12-28T16:23:58Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM
for Cyber-Physical Production Systems [63.62764375279861]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time
Series [79.64785804590821]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Knowledge Augmented Machine Learning with Applications in Autonomous
Driving: A Survey [37.84106999449108]
この研究は、データ駆動モデルと既存の知識を組み合わせた既存の技術と手法の概要を提供する。
同定されたアプローチは、知識の統合、抽出、整合性に応じて構成される。
特に、自律運転分野における提案手法の適用について述べる。
論文 参考訳(メタデータ) (2022-05-10T07:25:32Z) - DIME: Fine-grained Interpretations of Multimodal Models via Disentangled
Local Explanations [119.1953397679783]
我々は,マルチモーダルモデルの解釈における最先端化に注力する。
提案手法であるDIMEは,マルチモーダルモデルの高精度かつきめ細かな解析を可能にする。
論文 参考訳(メタデータ) (2022-03-03T20:52:47Z) - Knowledge-Guided Dynamic Systems Modeling: A Case Study on Modeling
River Water Quality [8.110949636804774]
実世界の現象をモデル化することは、エコロジーモデリングや財務予測など、多くの科学と工学の取り組みの焦点である。
複雑な動的システムのための正確なモデルの構築は、基盤となるプロセスの理解を改善し、リソース効率に繋がる。
反対の極端に、データ駆動モデリングはデータから直接モデルを学び、広範囲なデータと潜在的に過剰なフィッティングを生成する。
中間的アプローチであるモデルリビジョンに注目し,事前知識とデータを組み合わせることで,両世界のベストを達成する。
論文 参考訳(メタデータ) (2021-03-01T06:31:38Z) - Data and its (dis)contents: A survey of dataset development and use in
machine learning research [11.042648980854487]
機械学習におけるデータの収集と利用方法に関する多くの懸念を調査します。
この分野の実践的かつ倫理的な問題のいくつかに対処するには、データのより慎重で徹底した理解が必要であると主張する。
論文 参考訳(メタデータ) (2020-12-09T22:13:13Z) - Principles and Practice of Explainable Machine Learning [12.47276164048813]
本稿では、特に機械学習(ML)とパターン認識モデルに関するデータ駆動手法に焦点を当てる。
メソッドの頻度と複雑さが増すにつれて、少なくともビジネスの利害関係者はモデルの欠点に懸念を抱いている。
我々は、業界実践者が説明可能な機械学習の分野をよりよく理解するための調査を実施した。
論文 参考訳(メタデータ) (2020-09-18T14:50:27Z) - Relating by Contrasting: A Data-efficient Framework for Multimodal
Generative Models [86.9292779620645]
生成モデル学習のための対照的なフレームワークを開発し、モダリティ間の共通性だけでなく、「関連」と「関連しない」マルチモーダルデータの区別によってモデルを訓練することができる。
提案手法では, 生成モデルを用いて, 関係のないサンプルから関連サンプルを正確に識別し, ラベルのない多モードデータの利用が可能となる。
論文 参考訳(メタデータ) (2020-07-02T15:08:11Z) - Towards CRISP-ML(Q): A Machine Learning Process Model with Quality
Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。
第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。
第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文 参考訳(メタデータ) (2020-03-11T08:25:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。