論文の概要: Ensuring the Robustness and Reliability of Data-Driven Knowledge
Discovery Models in Production and Manufacturing
- arxiv url: http://arxiv.org/abs/2007.14791v1
- Date: Tue, 28 Jul 2020 14:21:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 01:53:20.224686
- Title: Ensuring the Robustness and Reliability of Data-Driven Knowledge
Discovery Models in Production and Manufacturing
- Title(参考訳): 生産・製造におけるデータ駆動型知識発見モデルの堅牢性と信頼性の確保
- Authors: Shailesh Tripathi, David Muhr, Brunner Manuel, Frank Emmert-Streib,
Herbert Jodlbauer, and Matthias Dehmer
- Abstract要約: データマイニングのクロス産業標準プロセス(CRISP-DM)は、データおよびモデル関連の問題に対処するために設計された。
本稿では、CRISP-DMモデルの拡張と、機械学習における各種データロバストネスおよびモデル-ロバストネス関連問題について概説する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The implementation of robust, stable, and user-centered data analytics and
machine learning models is confronted by numerous challenges in production and
manufacturing. Therefore, a systematic approach is required to develop,
evaluate, and deploy such models. The data-driven knowledge discovery framework
provides an orderly partition of the data-mining processes to ensure the
practical implementation of data analytics and machine learning models.
However, the practical application of robust industry-specific data-driven
knowledge discovery models faces multiple data-- and model-development--related
issues. These issues should be carefully addressed by allowing a flexible,
customized, and industry-specific knowledge discovery framework; in our case,
this takes the form of the cross-industry standard process for data mining
(CRISP-DM). This framework is designed to ensure active cooperation between
different phases to adequately address data- and model-related issues. In this
paper, we review several extensions of CRISP-DM models and various
data-robustness-- and model-robustness--related problems in machine learning,
which currently lacks proper cooperation between data experts and business
experts because of the limitations of data-driven knowledge discovery models.
- Abstract(参考訳): 堅牢で安定した、ユーザ中心のデータ分析と機械学習モデルの実装は、生産と製造における多くの課題に直面している。
したがって、そのようなモデルを開発、評価、展開するには体系的なアプローチが必要である。
データ駆動知識発見フレームワークは、データ分析と機械学習モデルの実用的な実装を保証するために、データマイニングプロセスの秩序ある分割を提供する。
しかしながら、堅牢な業界固有のデータ駆動知識発見モデルの実用的応用は、複数のデータ開発とモデル開発に関連する問題に直面している。
これらの問題は、フレキシブルで、カスタマイズされ、業界固有の知識発見フレームワークを提供することで、慎重に対処する必要があります。
このフレームワークは、データおよびモデル関連の問題に適切に対処するために、異なるフェーズ間のアクティブな協調を保証するように設計されている。
本稿では,データ駆動型知識発見モデルの限界により,現在データ専門家とビジネスエキスパートの適切な連携が欠如している機械学習における,split-dmモデルとさまざまなデータロバスト性問題の拡張について概説する。
関連論文リスト
- iNNspector: Visual, Interactive Deep Model Debugging [8.997568393450768]
本研究では,ディープラーニング実験のデータ空間を構造化する概念的枠組みを提案する。
我々のフレームワークは設計の次元を捉え、このデータを探索可能かつ抽出可能にするためのメカニズムを提案する。
我々は、ディープラーニング実験の追跡を可能にし、データのインタラクティブな可視化を提供するiNNspectorシステムを提案する。
論文 参考訳(メタデータ) (2024-07-25T12:48:41Z) - Data-Juicer Sandbox: A Comprehensive Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは包括的な実験プラットフォームを提供し、データとモデルの両方の迅速なイテレーションと洞察駆動による改善を可能にする。
また、徹底的なベンチマークから得られた実りある洞察を明らかにし、データ品質、多様性、モデル行動の間の重要な相互作用に光を当てています。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - HEMM: Holistic Evaluation of Multimodal Foundation Models [91.60364024897653]
マルチモーダル・ファンデーション・モデルは、画像、ビデオ、オーディオ、その他の知覚モダリティと共にテキストをホリスティックに処理することができる。
モデリング決定、タスク、ドメインの範囲を考えると、マルチモーダル基盤モデルの進歩を特徴づけ、研究することは困難である。
論文 参考訳(メタデータ) (2024-07-03T18:00:48Z) - Learning Paradigms and Modelling Methodologies for Digital Twins in Process Industry [1.1060425537315088]
デジタルツイン(Digital Twins、DT)は、センサーデータと高度なデータベースまたは物理ベースのモデル、あるいはその組み合わせを組み合わせた物理製造システムの仮想レプリカで、プロセス監視、予測制御、意思決定支援など、さまざまな産業関連タスクに対処する。
DTのバックボーン、すなわち、これらのモデルをサポートする具体的なモデリング方法論とアーキテクチャフレームワークは、複雑で多様性があり、急速に進化し、最新の最先端の手法と競争の激しい市場のトップに留まる傾向を徹底的に理解する必要がある。
論文 参考訳(メタデータ) (2024-07-02T14:05:10Z) - AI Competitions and Benchmarks: Dataset Development [42.164845505628506]
本章では,我々の実践経験に富んだ,確立した方法論ツールの概要について概観する。
データセット開発に関わるタスクを開発し、その効果的な管理に関する洞察を提供する。
次に、データ収集、変換、品質評価を含む実装プロセスの詳細について述べる。
論文 参考訳(メタデータ) (2024-04-15T12:01:42Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Knowledge Augmented Machine Learning with Applications in Autonomous
Driving: A Survey [37.84106999449108]
この研究は、データ駆動モデルと既存の知識を組み合わせた既存の技術と手法の概要を提供する。
同定されたアプローチは、知識の統合、抽出、整合性に応じて構成される。
特に、自律運転分野における提案手法の適用について述べる。
論文 参考訳(メタデータ) (2022-05-10T07:25:32Z) - Data and its (dis)contents: A survey of dataset development and use in
machine learning research [11.042648980854487]
機械学習におけるデータの収集と利用方法に関する多くの懸念を調査します。
この分野の実践的かつ倫理的な問題のいくつかに対処するには、データのより慎重で徹底した理解が必要であると主張する。
論文 参考訳(メタデータ) (2020-12-09T22:13:13Z) - Relating by Contrasting: A Data-efficient Framework for Multimodal
Generative Models [86.9292779620645]
生成モデル学習のための対照的なフレームワークを開発し、モダリティ間の共通性だけでなく、「関連」と「関連しない」マルチモーダルデータの区別によってモデルを訓練することができる。
提案手法では, 生成モデルを用いて, 関係のないサンプルから関連サンプルを正確に識別し, ラベルのない多モードデータの利用が可能となる。
論文 参考訳(メタデータ) (2020-07-02T15:08:11Z) - Towards CRISP-ML(Q): A Machine Learning Process Model with Quality
Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。
第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。
第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文 参考訳(メタデータ) (2020-03-11T08:25:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。