論文の概要: Multi-Modal Fusion of In-Situ Video Data and Process Parameters for Online Forecasting of Cookie Drying Readiness
- arxiv url: http://arxiv.org/abs/2504.15599v1
- Date: Tue, 22 Apr 2025 05:37:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 22:20:31.916839
- Title: Multi-Modal Fusion of In-Situ Video Data and Process Parameters for Online Forecasting of Cookie Drying Readiness
- Title(参考訳): クッキー乾燥準備のオンライン予測のためのその場ビデオデータのマルチモーダル融合とプロセスパラメータ
- Authors: Shichen Li, Chenhui Shao,
- Abstract要約: 本稿では,リアルタイム食品乾燥予測のためのプロセスパラメータとその場のビデオデータを統合する,エンドツーエンドのマルチモーダルデータ融合フレームワークを提案する。
本手法を糖類乾燥に適用し, タイムスタンプ毎に時間と可読性を予測した。
我々のモデルは平均15秒の予測誤差を達成し、65.69%の最先端データ融合法、11.30%の動画のみのモデルを実現した。
- 参考スコア(独自算出の注目度): 0.11510009152620666
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Food drying is essential for food production, extending shelf life, and reducing transportation costs. Accurate real-time forecasting of drying readiness is crucial for minimizing energy consumption, improving productivity, and ensuring product quality. However, this remains challenging due to the dynamic nature of drying, limited data availability, and the lack of effective predictive analytical methods. To address this gap, we propose an end-to-end multi-modal data fusion framework that integrates in-situ video data with process parameters for real-time food drying readiness forecasting. Our approach leverages a new encoder-decoder architecture with modality-specific encoders and a transformer-based decoder to effectively extract features while preserving the unique structure of each modality. We apply our approach to sugar cookie drying, where time-to-ready is predicted at each timestamp. Experimental results demonstrate that our model achieves an average prediction error of only 15 seconds, outperforming state-of-the-art data fusion methods by 65.69% and a video-only model by 11.30%. Additionally, our model balances prediction accuracy, model size, and computational efficiency, making it well-suited for heterogenous industrial datasets. The proposed model is extensible to various other industrial modality fusion tasks for online decision-making.
- Abstract(参考訳): 食品の乾燥は食品生産に不可欠であり、棚の寿命を延ばし、輸送コストを削減している。
エネルギー消費を最小化し、生産性を向上し、製品品質を確保するためには、正確な乾燥準備のリアルタイム予測が不可欠である。
しかし、乾燥の動的な性質、データ可用性の制限、効果的な予測分析方法の欠如により、これは依然として困難である。
このギャップに対処するために,リアルタイム食品乾燥予測のためのプロセスパラメータとその場のビデオデータを統合する,エンドツーエンドのマルチモーダルデータ融合フレームワークを提案する。
提案手法では,モダリティ固有のエンコーダとトランスフォーマーベースのデコーダを備えた新しいエンコーダデコーダアーキテクチャを用いて,各モダリティのユニークな構造を保ちながら,特徴を効果的に抽出する。
本手法を糖類乾燥に適用し, タイムスタンプ毎に時間と可読性を予測した。
実験結果から,本モデルでは平均誤差が15秒であり,65.69%,ビデオのみのモデルでは11.30%であった。
さらに、予測精度、モデルサイズ、計算効率のバランスをとり、異種産業データセットに適している。
提案手法は, オンライン意思決定のための様々な産業的モダリティ融合タスクに拡張可能である。
関連論文リスト
- Multi-Modal Data Fusion for Moisture Content Prediction in Apple Drying [0.11510009152620666]
乾燥工程の品質管理には,最終水分量(MC)の正確な予測が不可欠である。
本稿では,2つのデータモダリティを効果的に融合する,新しいマルチモーダルデータ融合フレームワークを提案する。
実験により,マルチモーダル手法は最先端手法と比較して予測精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-04-10T05:29:04Z) - Advancing Semantic Caching for LLMs with Domain-Specific Embeddings and Synthetic Data [3.877325424485755]
本報告では, セマンティックキャッシングの精度向上を, 特別に調整された埋め込みモデルを用いて検討する。
そこで本研究では,ターゲットとした実世界と合成されたデータセットを微調整した,より小さなドメイン固有埋め込みモデルを提案する。
論文 参考訳(メタデータ) (2025-04-03T04:27:02Z) - AccVideo: Accelerating Video Diffusion Model with Synthetic Dataset [55.82208863521353]
合成データセットを用いたビデオ拡散モデルの高速化のための推論ステップを削減するために,AccVideoを提案する。
本モデルでは,教師モデルに比べて生成速度が8.5倍向上した。
従来の高速化手法と比較して,より高品質で解像度の高いビデオを生成することができる。
論文 参考訳(メタデータ) (2025-03-25T08:52:07Z) - Generative Dataset Distillation Based on Self-knowledge Distillation [49.20086587208214]
本稿では,予測ロジットの整列精度を向上させる新しい生成データセット蒸留法を提案する。
本手法は, 合成データと原データとのより正確な分布マッチングを実現するために, 自己知識蒸留を統合したものである。
提案手法は, 既存の最先端手法より優れており, 蒸留性能が良好である。
論文 参考訳(メタデータ) (2025-01-08T00:43:31Z) - Efficient Fine-Tuning and Concept Suppression for Pruned Diffusion Models [93.76814568163353]
本稿では,2段階の拡散モデルに対する新しい最適化フレームワークを提案する。
このフレームワークは、微調整と未学習のプロセスを統一的なフェーズに統合する。
様々なプルーニングや概念未学習の手法と互換性がある。
論文 参考訳(メタデータ) (2024-12-19T19:13:18Z) - Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - Sparse Attention-driven Quality Prediction for Production Process Optimization in Digital Twins [53.70191138561039]
データ駆動方式で運用ロジックを符号化することで,生産ラインのディジタルツインをデプロイすることを提案する。
我々は,自己注意型時間畳み込みニューラルネットワークに基づく生産プロセスの品質予測モデルを採用する。
本手法は,本手法により,仮想及び実生産ライン間のシームレスな統合を促進できることを示す。
論文 参考訳(メタデータ) (2024-05-20T09:28:23Z) - Goldfish: An Efficient Federated Unlearning Framework [3.956103498302838]
Goldfishは機械学習アルゴリズムのための新しいフレームワークだ。
基本モデル、損失関数、最適化、拡張の4つのモジュールで構成されている。
既存の機械学習アルゴリズムの妥当性の低い課題に対処するため,新しい損失関数を提案する。
論文 参考訳(メタデータ) (2024-04-04T03:29:41Z) - AdaDiff: Accelerating Diffusion Models through Step-Wise Adaptive Computation [32.74923906921339]
拡散モデルは多彩で高忠実な画像を生成する上で大きな成功を収めるが、それらの応用は本質的に遅い生成速度によって妨げられる。
本稿では,拡散モデルの生成効率を向上させるために,各サンプリングステップで動的に計算資源を割り当てる適応フレームワークであるAdaDiffを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:10:04Z) - Precision-Recall Divergence Optimization for Generative Modeling with
GANs and Normalizing Flows [54.050498411883495]
本研究では,ジェネレーティブ・アドバイサル・ネットワークや正規化フローなどの生成モデルのための新しいトレーニング手法を開発した。
指定された精度-リコールトレードオフを達成することは、textitPR-divergencesと呼ぶ家族からのユニークな$f$-divergenceを最小化することを意味する。
当社のアプローチは,ImageNetなどのデータセットでテストした場合の精度とリコールの両面で,BigGANのような既存の最先端モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-05-30T10:07:17Z) - A Bayesian Generative Adversarial Network (GAN) to Generate Synthetic
Time-Series Data, Application in Combined Sewer Flow Prediction [3.3139597764446607]
機械学習では、生成モデル(generative model)は、データ分散を学習して人工データを生成する方法のクラスである。
本研究では,限られた時系列データのバランスをとるために,合成時系列を生成するGANモデルを開発した。
本研究の目的は, 降水量データを用いて流れを予測し, モデル性能における合成データを用いたデータ増大の影響を検討することである。
論文 参考訳(メタデータ) (2023-01-31T16:12:26Z) - Improving non-deterministic uncertainty modelling in Industry 4.0
scheduling [0.0]
本稿では,確率的不確実性モデリングによる非決定的不確実性を定量化する包括的手法を提案する。
結果はベルギーのフランダースにある産業データによって数値的に検証される。
論文 参考訳(メタデータ) (2021-01-08T23:17:55Z) - VAE-LIME: Deep Generative Model Based Approach for Local Data-Driven
Model Interpretability Applied to the Ironmaking Industry [70.10343492784465]
モデル予測だけでなく、その解釈可能性も、プロセスエンジニアに公開する必要があります。
LIMEに基づくモデルに依存しない局所的解釈可能性ソリューションが最近出現し、元の手法が改良された。
本稿では, 燃焼炉で生成する高温金属の温度を推定するデータ駆動型モデルの局所的解釈可能性に関する新しいアプローチ, VAE-LIMEを提案する。
論文 参考訳(メタデータ) (2020-07-15T07:07:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。