Fugu-MT 論文翻訳(概要): Ensuring the Robustness and Reliability of Data-Driven Knowledge Discovery Models in Production and Manufacturing

論文の概要: Ensuring the Robustness and Reliability of Data-Driven Knowledge Discovery Models in Production and Manufacturing

arxiv url: http://arxiv.org/abs/2007.14791v1
Date: Tue, 28 Jul 2020 14:21:14 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-06 01:53:20.224686
Title: Ensuring the Robustness and Reliability of Data-Driven Knowledge Discovery Models in Production and Manufacturing
Title（参考訳）: 生産・製造におけるデータ駆動型知識発見モデルの堅牢性と信頼性の確保
Authors: Shailesh Tripathi, David Muhr, Brunner Manuel, Frank Emmert-Streib, Herbert Jodlbauer, and Matthias Dehmer
Abstract要約: データマイニングのクロス産業標準プロセス(CRISP-DM)は、データおよびモデル関連の問題に対処するために設計された。本稿では、CRISP-DMモデルの拡張と、機械学習における各種データロバストネスおよびモデル-ロバストネス関連問題について概説する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The implementation of robust, stable, and user-centered data analytics and machine learning models is confronted by numerous challenges in production and manufacturing. Therefore, a systematic approach is required to develop, evaluate, and deploy such models. The data-driven knowledge discovery framework provides an orderly partition of the data-mining processes to ensure the practical implementation of data analytics and machine learning models. However, the practical application of robust industry-specific data-driven knowledge discovery models faces multiple data-- and model-development--related issues. These issues should be carefully addressed by allowing a flexible, customized, and industry-specific knowledge discovery framework; in our case, this takes the form of the cross-industry standard process for data mining (CRISP-DM). This framework is designed to ensure active cooperation between different phases to adequately address data- and model-related issues. In this paper, we review several extensions of CRISP-DM models and various data-robustness-- and model-robustness--related problems in machine learning, which currently lacks proper cooperation between data experts and business experts because of the limitations of data-driven knowledge discovery models.
Abstract（参考訳）: 堅牢で安定した、ユーザ中心のデータ分析と機械学習モデルの実装は、生産と製造における多くの課題に直面している。したがって、そのようなモデルを開発、評価、展開するには体系的なアプローチが必要である。データ駆動知識発見フレームワークは、データ分析と機械学習モデルの実用的な実装を保証するために、データマイニングプロセスの秩序ある分割を提供する。しかしながら、堅牢な業界固有のデータ駆動知識発見モデルの実用的応用は、複数のデータ開発とモデル開発に関連する問題に直面している。これらの問題は、フレキシブルで、カスタマイズされ、業界固有の知識発見フレームワークを提供することで、慎重に対処する必要があります。このフレームワークは、データおよびモデル関連の問題に適切に対処するために、異なるフェーズ間のアクティブな協調を保証するように設計されている。本稿では,データ駆動型知識発見モデルの限界により,現在データ専門家とビジネスエキスパートの適切な連携が欠如している機械学習における,split-dmモデルとさまざまなデータロバスト性問題の拡張について概説する。

関連論文リスト

Scaling Generalist Data-Analytic Agents [95.05161133349242]
DataMindは、汎用データ分析エージェントを構築するために設計されたスケーラブルなデータ合成およびエージェントトレーニングレシピである。 DataMindは、オープンソースのデータ分析エージェントを構築する上で重要な3つの課題に取り組む。
論文参考訳（メタデータ） (2025-09-29T17:23:08Z)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
AdvKT: An Adversarial Multi-Step Training Framework for Knowledge Tracing [64.79967583649407]
知識追跡(KT)は、学生の知識状態を監視し、質問シーケンスに対する反応をシミュレートする。既存のKTモデルは通常、単一ステップのトレーニングパラダイムに従っており、大きなエラーの蓄積につながる。本稿では,多段階KTタスクに着目した新しい知識追跡のための多段階学習フレームワーク(AdvKT)を提案する。
論文参考訳（メタデータ） (2025-04-07T03:31:57Z)
Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.17057231661371]
時系列解析は複雑なシステムの力学を理解するために重要である。基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文参考訳（メタデータ） (2025-03-14T13:53:46Z)
Mitigating Attrition: Data-Driven Approach Using Machine Learning and Data Engineering [0.0]
本稿では、機械学習とデータエンジニアリング技術を用いて、従業員の誘惑を緩和する新しいデータ駆動アプローチを提案する。提案フレームワークは, 多様な人的資源システムからのデータを統合し, 高度な特徴工学を活用して, 誘惑に影響を及ぼす要因を包括的に把握する。
論文参考訳（メタデータ） (2025-02-25T05:29:45Z)
iNNspector: Visual, Interactive Deep Model Debugging [8.997568393450768]
本研究では,ディープラーニング実験のデータ空間を構造化する概念的枠組みを提案する。我々のフレームワークは設計の次元を捉え、このデータを探索可能かつ抽出可能にするためのメカニズムを提案する。我々は、ディープラーニング実験の追跡を可能にし、データのインタラクティブな可視化を提供するiNNspectorシステムを提案する。
論文参考訳（メタデータ） (2024-07-25T12:48:41Z)
Data-Juicer Sandbox: A Comprehensive Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。このサンドボックスは包括的な実験プラットフォームを提供し、データとモデルの両方の迅速なイテレーションと洞察駆動による改善を可能にする。また、徹底的なベンチマークから得られた実りある洞察を明らかにし、データ品質、多様性、モデル行動の間の重要な相互作用に光を当てています。
論文参考訳（メタデータ） (2024-07-16T14:40:07Z)
HEMM: Holistic Evaluation of Multimodal Foundation Models [91.60364024897653]
マルチモーダル・ファンデーション・モデルは、画像、ビデオ、オーディオ、その他の知覚モダリティと共にテキストをホリスティックに処理することができる。モデリング決定、タスク、ドメインの範囲を考えると、マルチモーダル基盤モデルの進歩を特徴づけ、研究することは困難である。
論文参考訳（メタデータ） (2024-07-03T18:00:48Z)
Learning Paradigms and Modelling Methodologies for Digital Twins in Process Industry [1.1060425537315088]
デジタルツイン(Digital Twins、DT)は、センサーデータと高度なデータベースまたは物理ベースのモデル、あるいはその組み合わせを組み合わせた物理製造システムの仮想レプリカで、プロセス監視、予測制御、意思決定支援など、さまざまな産業関連タスクに対処する。 DTのバックボーン、すなわち、これらのモデルをサポートする具体的なモデリング方法論とアーキテクチャフレームワークは、複雑で多様性があり、急速に進化し、最新の最先端の手法と競争の激しい市場のトップに留まる傾向を徹底的に理解する必要がある。
論文参考訳（メタデータ） (2024-07-02T14:05:10Z)
AI Competitions and Benchmarks: Dataset Development [42.164845505628506]
本章では,我々の実践経験に富んだ,確立した方法論ツールの概要について概観する。データセット開発に関わるタスクを開発し、その効果的な管理に関する洞察を提供する。次に、データ収集、変換、品質評価を含む実装プロセスの詳細について述べる。
論文参考訳（メタデータ） (2024-04-15T12:01:42Z)
Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-12-22T02:12:08Z)
TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文参考訳（メタデータ） (2023-05-19T10:11:21Z)
Knowledge Augmented Machine Learning with Applications in Autonomous Driving: A Survey [37.84106999449108]
この研究は、データ駆動モデルと既存の知識を組み合わせた既存の技術と手法の概要を提供する。同定されたアプローチは、知識の統合、抽出、整合性に応じて構成される。特に、自律運転分野における提案手法の適用について述べる。
論文参考訳（メタデータ） (2022-05-10T07:25:32Z)
Data and its (dis)contents: A survey of dataset development and use in machine learning research [11.042648980854487]
機械学習におけるデータの収集と利用方法に関する多くの懸念を調査します。この分野の実践的かつ倫理的な問題のいくつかに対処するには、データのより慎重で徹底した理解が必要であると主張する。
論文参考訳（メタデータ） (2020-12-09T22:13:13Z)
Relating by Contrasting: A Data-efficient Framework for Multimodal Generative Models [86.9292779620645]
生成モデル学習のための対照的なフレームワークを開発し、モダリティ間の共通性だけでなく、「関連」と「関連しない」マルチモーダルデータの区別によってモデルを訓練することができる。提案手法では, 生成モデルを用いて, 関係のないサンプルから関連サンプルを正確に識別し, ラベルのない多モードデータの利用が可能となる。
論文参考訳（メタデータ） (2020-07-02T15:08:11Z)
Towards CRISP-ML(Q): A Machine Learning Process Model with Quality Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文参考訳（メタデータ） (2020-03-11T08:25:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。