論文の概要: End-to-End Data Quality-Driven Framework for Machine Learning in Production Environment
- arxiv url: http://arxiv.org/abs/2512.19723v1
- Date: Tue, 16 Dec 2025 20:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.596538
- Title: End-to-End Data Quality-Driven Framework for Machine Learning in Production Environment
- Title(参考訳): 生産環境における機械学習のためのエンドツーエンドデータ品質駆動フレームワーク
- Authors: Firas Bayram, Bestoun S. Ahmed, Erik Hallin,
- Abstract要約: 本稿では、リアルタイム生産環境におけるデータ品質評価と機械学習(ML)モデル操作を効率的に統合する新しいエンドツーエンドフレームワークを提案する。
主なイノベーションは、その運用効率であり、最小の計算オーバーヘッドで、リアルタイムで品質駆動のML意思決定を可能にする。
- 参考スコア(独自算出の注目度): 2.24303609250571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a novel end-to-end framework that efficiently integrates data quality assessment with machine learning (ML) model operations in real-time production environments. While existing approaches treat data quality assessment and ML systems as isolated processes, our framework addresses the critical gap between theoretical methods and practical implementation by combining dynamic drift detection, adaptive data quality metrics, and MLOps into a cohesive, lightweight system. The key innovation lies in its operational efficiency, enabling real-time, quality-driven ML decision-making with minimal computational overhead. We validate the framework in a steel manufacturing company's Electroslag Remelting (ESR) vacuum pumping process, demonstrating a 12% improvement in model performance (R2 = 94%) and a fourfold reduction in prediction latency. By exploring the impact of data quality acceptability thresholds, we provide actionable insights into balancing data quality standards and predictive performance in industrial applications. This framework represents a significant advancement in MLOps, offering a robust solution for time-sensitive, data-driven decision-making in dynamic industrial environments.
- Abstract(参考訳): 本稿では、リアルタイム生産環境におけるデータ品質評価と機械学習(ML)モデル操作を効率的に統合する新しいエンドツーエンドフレームワークを提案する。
既存の手法はデータ品質評価とMLシステムを独立したプロセスとして扱うが、我々のフレームワークは動的ドリフト検出、適応データ品質メトリクス、MLOpsを結合的で軽量なシステムに組み合わせることで、理論的手法と実践的実装の重大なギャップに対処する。
重要なイノベーションは、その運用効率にあり、最小の計算オーバーヘッドで、リアルタイムで品質駆動のML意思決定を可能にする。
製鋼会社の電子スラグ再溶融(ESR)真空ポンププロセスにおいて, モデル性能の12%向上(R2=94%)と予測遅延の4倍の低下を実証した。
データ品質の許容可能性しきい値の影響を探索することにより、産業アプリケーションにおけるデータ品質標準と予測性能のバランスに関する実用的な洞察を提供する。
このフレームワークは、動的産業環境において、時間に敏感でデータ駆動型意思決定のための堅牢なソリューションを提供するMLOpsの大幅な進歩を表している。
関連論文リスト
- Out of Distribution Detection for Efficient Continual Learning in Quality Prediction for Arc Welding [10.828273858204431]
現代の製造は、ガス金属アーク溶接(GMAW)を含む核融合溶接プロセスに大きく依存している。
現在のモデルでは、動的製造環境において発生する固有の分布シフトに直面すると、限界が示される。
我々は,VQ-VAEトランスフォーマーアーキテクチャを拡張し,その自己回帰損失を信頼性のあるアウト・オブ・ディストリビューション(OOD)検出機構として活用する。
論文 参考訳(メタデータ) (2025-08-22T23:09:21Z) - Data-Driven Differential Evolution in Tire Industry Extrusion: Leveraging Surrogate Models [0.0]
本研究では,複雑な実世界の製造システムを最適化するためのサロゲートに基づくデータ駆動手法を提案する。
機械学習モデルは、システム挙動を近似し、サロゲートモデルを構築するために使用され、それは、調整されたメタヒューリスティックなアプローチに統合される。
以上の結果から,サロゲートに基づく最適化手法は歴史的最良構成よりも優れていた。
論文 参考訳(メタデータ) (2025-07-15T10:52:45Z) - Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark [62.58869921806019]
GPT-4oに基づくタスク分解評価フレームワークを提案し、新しいトレーニングデータセットを自動構築する。
我々は、GPT-4oの評価能力を7BオープンソースMLLM、MiniCPM-V-2.6に効果的に蒸留するための革新的なトレーニング戦略を設計する。
実験結果から,我々の蒸留したオープンソースMLLMは,現在のGPT-4oベースラインよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-11-23T08:06:06Z) - Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning [71.2981957820888]
本稿では,データセット間のデータ品質向上を自動化する新しいStar-Agentsフレームワークを提案する。
このフレームワークは最初,複数のLDMエージェントを用いた多様なインストラクションデータを生成する。
生成したデータは、難易度と品質の両方を評価する二重モデル法を用いて厳密な評価を行う。
論文 参考訳(メタデータ) (2024-11-21T02:30:53Z) - Adaptive Data Quality Scoring Operations Framework using Drift-Aware Mechanism for Industrial Applications [0.0]
本稿では,産業データストリームの動的品質次元がもたらす課題に対処する新しい枠組みを提案する。
このフレームワークは動的変更検出機構を統合し、データ品質の変化を積極的に監視し、適応する。
実験結果は、予測性能と効率的な処理時間を示し、実用的な品質駆動型AIアプリケーションにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2024-08-13T08:32:06Z) - Sparse Attention-driven Quality Prediction for Production Process Optimization in Digital Twins [53.70191138561039]
データ駆動方式で運用ロジックを符号化することで,生産ラインのディジタルツインをデプロイすることを提案する。
我々は,自己注意型時間畳み込みニューラルネットワークに基づく生産プロセスの品質予測モデルを採用する。
本手法は,本手法により,仮想及び実生産ライン間のシームレスな統合を促進できることを示す。
論文 参考訳(メタデータ) (2024-05-20T09:28:23Z) - Evaluating the Energy Efficiency of Few-Shot Learning for Object
Detection in Industrial Settings [6.611985866622974]
本稿では、下流タスクに標準オブジェクト検出モデルを適用するための微調整手法を提案する。
開発モデルにおけるエネルギー需要のケーススタディと評価について述べる。
最後に、このトレードオフを、カスタマイズされた効率係数測定によって定量化する新しい方法を紹介する。
論文 参考訳(メタデータ) (2024-03-11T11:41:30Z) - MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot
Learning [52.101643259906915]
本研究では,高次元観測による強化学習におけるオフライン事前学習とオンラインファインチューニングの問題について検討する。
既存のモデルベースオフラインRL法は高次元領域におけるオフラインからオンラインへの微調整には適していない。
本稿では,事前データをモデルベース値拡張とポリシー正則化によって効率的に再利用できるオンラインモデルベース手法を提案する。
論文 参考訳(メタデータ) (2024-01-06T21:04:31Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Quality In / Quality Out: Data quality more relevant than model choice in anomaly detection with the UGR'16 [0.29998889086656577]
ベンチマークデータセットの比較的小さな変更は、考慮された特定のML手法よりも、モデルパフォーマンスに著しく影響することを示します。
また、不正確なラベル付けの結果、測定されたモデル性能が不確かであることも示す。
論文 参考訳(メタデータ) (2023-05-31T12:03:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。