論文の概要: Operationalization of Machine Learning with Serverless Architecture: An Industrial Operationalization of Machine Learning with Serverless Architecture: An Industrial Implementation for Harmonized System Code Prediction
- arxiv url: http://arxiv.org/abs/2602.17102v1
- Date: Thu, 19 Feb 2026 05:59:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.715931
- Title: Operationalization of Machine Learning with Serverless Architecture: An Industrial Operationalization of Machine Learning with Serverless Architecture: An Industrial Implementation for Harmonized System Code Prediction
- Title(参考訳): サーバレスアーキテクチャによる機械学習の運用:サーバレスアーキテクチャによる機械学習の産業的運用:調和システムコード予測のための産業的実装
- Authors: Sai Vineeth Kandappareddigari, Santhoshkumar Jagadish, Gauri Verma, Ilhuicamina Contreras, Christopher Dignam, Anmol Srivastava, Benjamin Demers,
- Abstract要約: 本稿では、データ取り込み、トレーニング、デプロイメント、監視、再トレーニングからイベント駆動パイプラインとマネージドサービスまで、完全なMLライフサイクルをオーケストレーションするサーバレスMLOpsフレームワークを提案する。
本研究では,グローバル取引において税関当局が使用する標準化コードに,短い非構造化製品記述をマッピングするコンプライアンスクリティカルなタスクである,調和システム(HS)コード予測の産業的実装を通じて,実践的適用性を実証する。
私たちのソリューションは、複数のディープラーニングアーキテクチャを埋め込んだカスタムテキストを使用します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a serverless MLOps framework orchestrating the complete ML lifecycle from data ingestion, training, deployment, monitoring, and retraining to using event-driven pipelines and managed services. The architecture is model-agnostic, supporting diverse inference patterns through standardized interfaces, enabling rapid adaptation without infrastructure overhead. We demonstrate practical applicability through an industrial implementation for Harmonized System (HS) code prediction, a compliance-critical task where short, unstructured product descriptions are mapped to standardized codes used by customs authorities in global trade. Frequent updates and ambiguous descriptions make classification challenging, with errors causing shipment delays and financial losses. Our solution uses a custom text embedding encoder and multiple deep learning architectures, with Text-CNN achieving 98 percent accuracy on ground truth data. Beyond accuracy, the pipeline ensures reproducibility, auditability, and SLA adherence under variable loads via auto-scaling. A key feature is automated A/B testing, enabling dynamic model selection and safe promotion in production. Cost-efficiency drives model choice; while transformers may achieve similar accuracy, their long-term operational costs are significantly higher. Deterministic classification with predictable latency and explainability is prioritized, though the architecture remains extensible to transformer variants and LLM-based inference. The paper first introduces the deep learning architectures with simulations and model comparisons, then discusses industrialization through serverless architecture, demonstrating automated retraining, prediction, and validation of HS codes. This work provides a replicable blueprint for operationalizing ML using serverless architecture, enabling enterprises to scale while optimizing performance and economics.
- Abstract(参考訳): 本稿では、データ取り込み、トレーニング、デプロイメント、監視、再トレーニングからイベント駆動パイプラインとマネージドサービスまで、完全なMLライフサイクルをオーケストレーションするサーバレスMLOpsフレームワークを提案する。
アーキテクチャはモデルに依存しないため、標準化されたインターフェースを通じて多様な推論パターンをサポートし、インフラストラクチャのオーバーヘッドなしに迅速に適応できる。
本研究では,グローバル取引において税関当局が使用する標準化コードに,短い非構造化製品記述をマッピングするコンプライアンスクリティカルなタスクである,調和システム(HS)コード予測の産業的実装を通じて,実践的適用性を実証する。
頻繁な更新とあいまいな説明は、出荷の遅れと財政的損失を引き起こすエラーを伴う分類を困難にしている。
私たちのソリューションは、カスタムテキスト埋め込みエンコーダと複数のディープラーニングアーキテクチャを使用しており、Text-CNNは98%の精度で地上の真実データに到達しています。
正確性以外にも、パイプラインは自動スケーリングによる可変負荷下での再現性、監査性、SLAの順守を保証する。
重要な機能は自動A/Bテストであり、動的モデルの選択と運用時の安全なプロモーションを可能にする。
コスト効率はモデル選択を駆動する; トランスフォーマーは同様の精度を達成するが、長期的な運用コストは著しく高い。
予測可能なレイテンシと説明可能性による決定論的分類が優先されるが、アーキテクチャは変圧器の変種やLLMベースの推論に拡張可能である。
まず、シミュレーションとモデル比較によるディープラーニングアーキテクチャを紹介し、次にサーバレスアーキテクチャによる工業化について論じ、自動再トレーニング、予測、HSコードの検証を実証する。
この作業は、サーバレスアーキテクチャを使用してMLを運用するためのレプリカ可能なブループリントを提供する。
関連論文リスト
- Query as Anchor: Scenario-Adaptive User Representation via Large Language Model [28.30329175937291]
静的エンコーディングから動的クエリ認識合成へユーザモデリングをシフトするフレームワークであるQuery-as-Anchorを提案する。
まず,産業規模の事前学習データセットであるUserUを構築し,行動系列とユーザ理解のセマンティクスを整合させる。
クラスタベースのSoft Prompt Tuningを導入し、識別潜在構造を強制する。
デプロイメントでは、シーケンスターミニでのクエリのアンカーにより、無視可能なインクリメンタルレイテンシでKVキャッシュを加速する推論が可能になる。
論文 参考訳(メタデータ) (2026-02-16T06:09:31Z) - Scaling LLM Speculative Decoding: Non-Autoregressive Forecasting in Large-Batch Scenarios [76.85739138203014]
本稿では,一方向および注目メカニズムを加速する新しいアーキテクチャであるSpecFormerを紹介する。
また,SpecFormerはトレーニング要求の低減と計算コストの削減を実現している。
論文 参考訳(メタデータ) (2025-11-25T14:20:08Z) - FELA: A Multi-Agent Evolutionary System for Feature Engineering of Industrial Event Log Data [7.129004248608012]
イベントログデータは、現代のデジタルサービスにとって最も価値のある資産の1つである。
AutoMLや遺伝的手法のような既存の機能エンジニアリングアプローチは、しばしば限定的な説明責任に悩まされる。
複雑なイベントログデータから有意義かつ高性能な特徴を自律的に抽出するマルチエージェント進化システムFELAを提案する。
論文 参考訳(メタデータ) (2025-10-29T06:57:32Z) - OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System [61.12400636463362]
OnePieceは、LLMスタイルのコンテキストエンジニアリングと推論を、検索モデルとランキングモデルの両方にシームレスに統合する統合フレームワークである。
OnePieceは、Shopeeの主要なパーソナライズされた検索シナリオにデプロイされ、さまざまな主要なビジネス指標で一貫したオンラインゲインを実現している。
論文 参考訳(メタデータ) (2025-09-22T17:59:07Z) - ZeroLM: Data-Free Transformer Architecture Search for Language Models [54.83882149157548]
現在の自動プロキシ発見アプローチは、検索時間の拡張、データの過度なオーバーフィットへの感受性、構造的な複雑さに悩まされている。
本稿では,効率的な重み統計によるモデルキャパシティの定量化を目的とした,新しいゼロコストプロキシ手法を提案する。
本評価は,FlexiBERT ベンチマークで Spearman's rho 0.76 と Kendall's tau 0.53 を達成し,このアプローチの優位性を示すものである。
論文 参考訳(メタデータ) (2025-03-24T13:11:22Z) - Mechanistic Design and Scaling of Hybrid Architectures [114.3129802943915]
我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。
本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。
我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文 参考訳(メタデータ) (2024-03-26T16:33:12Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。