論文の概要: Integrating AI and Ensemble Forecasting: Explainable Materials Planning with Scorecards and Trend Insights for a Large-Scale Manufacturer
- arxiv url: http://arxiv.org/abs/2510.01006v1
- Date: Wed, 01 Oct 2025 15:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.635695
- Title: Integrating AI and Ensemble Forecasting: Explainable Materials Planning with Scorecards and Trend Insights for a Large-Scale Manufacturer
- Title(参考訳): AIとアンサンブル予測の統合: スコアカードによる説明可能な材料計画と大規模製造業者の動向
- Authors: Saravanan Venkatachalam,
- Abstract要約: 本稿では,アフターセール需要予測とモニタリングのための実用的アーキテクチャを提案する。
統計モデル、機械学習モデル、ディープラーニングモデルの、収益とクラスタ対応のアンサンブルを統合する。
システムは90か国以上、約6,000の部品の予測、監視、在庫決定のループを閉じる。
- 参考スコア(独自算出の注目度): 0.45687771576879593
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper presents a practical architecture for after-sales demand forecasting and monitoring that unifies a revenue- and cluster-aware ensemble of statistical, machine-learning, and deep-learning models with a role-driven analytics layer for scorecards and trend diagnostics. The framework ingests exogenous signals (installed base, pricing, macro indicators, life cycle, seasonality) and treats COVID-19 as a distinct regime, producing country-part forecasts with calibrated intervals. A Pareto-aware segmentation forecasts high-revenue items individually and pools the long tail via clusters, while horizon-aware ensembling aligns weights with business-relevant losses (e.g., WMAPE). Beyond forecasts, a performance scorecard delivers decision-focused insights: accuracy within tolerance thresholds by revenue share and count, bias decomposition (over- vs under-forecast), geographic and product-family hotspots, and ranked root causes tied to high-impact part-country pairs. A trend module tracks trajectories of MAPE/WMAPE and bias across recent months, flags entities that are improving or deteriorating, detects change points aligned with known regimes, and attributes movements to lifecycle and seasonal factors. LLMs are embedded in the analytics layer to generate role-aware narratives and enforce reporting contracts. They standardize business definitions, automate quality checks and reconciliations, and translate quantitative results into concise, explainable summaries for planners and executives. The system exposes a reproducible workflow -- request specification, model execution, database-backed artifacts, and AI-generated narratives -- so planners can move from "How accurate are we now?" to "Where is accuracy heading and which levers should we pull?", closing the loop between forecasting, monitoring, and inventory decisions across more than 90 countries and about 6,000 parts.
- Abstract(参考訳): 本稿では、統計、機械学習、ディープラーニングモデルの収益とクラスタを考慮したアンサンブルを、スコアカードとトレンド診断のためのロール駆動分析層で統合する、アフターセール需要予測とモニタリングのための実践的アーキテクチャを提案する。
このフレームワークは、外因性シグナル(インストールベース、価格、マクロ指標、ライフサイクル、季節性)を取り込み、新型コロナウイルスを別の体制として扱い、調整された間隔で国別予測を生成する。
パレート・アウェア・セグメンテーション(Pareto-aware segmentation)は、個々の高価値アイテムを予測し、クラスタを介してロングテールをプールし、ホライズー・アウェア・アンサンブルは、ビジネス関連損失(WMAPEなど)と重みを一致させる。
予測を超えて、パフォーマンススコアカードは、収益シェアとカウントによる許容しきい値内の正確性、バイアス分解(オーバー・対アン・フォア・キャスト)、地理的および製品中心のホットスポット、そして、高いインパクトのあるパート・カントリーのペアに関連する根本原因という、決定に焦点を当てた洞察を提供する。
トレンドモジュールは、最近の数ヶ月間のMAPE/WMAPEの軌跡とバイアスを追跡し、改善または劣化しているフラグエンティティを検知し、既知のレシエーションと整合した変更点を検出し、ライフサイクルと季節要因に作用する。
LLMは分析層に埋め込まれ、ロールアウェアな物語を生成し、レポート契約を強制する。
ビジネス定義を標準化し、品質チェックと調整を自動化し、定量的な結果をプランナーと幹部の簡潔で説明可能な要約に翻訳する。
システムは -- 要求仕様、モデル実行、データベース支援されたアーティファクト、AI生成のストーリ -- を再現可能なワークフローとして公開しているため、プランナは“現在どれくらい正確か?”から、“どのレバーを引っ張るべきか?”に移行し、90か国以上、約6,000のパートで予測、監視、在庫決定のループを閉じる。
関連論文リスト
- TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis [25.377586527585503]
TimeSeriesScientist(TSci)は時系列予測のための一般的なドメインに依存しないフレームワークである。
これはそれぞれ平均10.4%と38.2%の予測誤差を減少させる。
透明な自然言語の合理性と包括的な報告により、TSciは予測をホワイトボックスシステムに変換する。
論文 参考訳(メタデータ) (2025-10-02T00:18:59Z) - A Survey of Reasoning and Agentic Systems in Time Series with Large Language Models [22.683448537572897]
時系列推論は時間を第一級軸として扱い、中間証拠を直接答えに組み込む。
本調査では,一段階における直接推論,明示的な中間体による線形連鎖推論,分岐構造推論という3つのファミリーによるトポロジの推論によって,問題を定義し,文献を整理する。
論文 参考訳(メタデータ) (2025-09-15T04:39:50Z) - Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting [0.0]
予測が販売水準を過小評価すると、企業は販売、不足、そして関連する市場での小売業者の評判に影響を及ぼす。
本研究は,高解像度のレンガとモルタルの小売データセットに適用した予測モデルを徹底的に評価する。
論文 参考訳(メタデータ) (2025-06-06T10:08:17Z) - Consistency Checks for Language Model Forecasters [54.62507816753479]
予測器の性能を,論理的に異なる質問に対する予測の整合性の観点から測定する。
我々は,一連の基本質問を生成し,これらの質問から整合性チェックをインスタンス化し,予測者の予測を導き,予測の整合性を測定する自動評価システムを構築した。
論文 参考訳(メタデータ) (2024-12-24T16:51:35Z) - A Comprehensive Forecasting Framework based on Multi-Stage Hierarchical Forecasting Reconciliation and Adjustment [16.859089765648356]
本稿では,季節性維持,コヒーレンス確保,精度向上という課題に対処する新しい枠組みを提案する。
提案されたフレームワークは、Walmartの広告、営業、運用チームが将来の要求を追跡するためにデプロイされ、活用されている。
論文 参考訳(メタデータ) (2024-12-19T10:33:19Z) - Eliminating Position Bias of Language Models: A Mechanistic Approach [119.34143323054143]
位置バイアスは現代言語モデル (LM) の一般的な問題であることが証明されている。
我々の力学解析は、ほぼ全ての最先端のLMで使われている2つのコンポーネント(因果的注意と相対的位置エンコーディング)に位置バイアスが関係している。
位置バイアスを排除することによって、LM-as-a-judge、検索強化QA、分子生成、数学推論など、下流タスクのパフォーマンスと信頼性が向上する。
論文 参考訳(メタデータ) (2024-07-01T09:06:57Z) - F-FOMAML: GNN-Enhanced Meta-Learning for Peak Period Demand Forecasting with Proxy Data [65.6499834212641]
本稿では,需要予測をメタラーニング問題として定式化し,F-FOMAMLアルゴリズムを開発した。
タスク固有のメタデータを通してドメインの類似性を考慮することにより、トレーニングタスクの数が増加するにつれて過剰なリスクが減少する一般化を改善した。
従来の最先端モデルと比較して,本手法では需要予測精度が著しく向上し,内部自動販売機データセットでは平均絶対誤差が26.24%,JD.comデータセットでは1.04%削減された。
論文 参考訳(メタデータ) (2024-06-23T21:28:50Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Making forecasting self-learning and adaptive -- Pilot forecasting rack [0.0]
本稿では,このような商品カテゴリーの予測精度向上を支援するための,積極的なパイロット・エクササイズに基づく本研究の成果について述べる。
我々は,サンプル製品カテゴリであるKnitwearに基づいて,予測精度を向上させるアルゴリズム介入の機会を評価した。
その結果,ニットウェア製品カテゴリーの需要予測の精度は20%向上し,全体の精度は80%向上した。
論文 参考訳(メタデータ) (2023-06-12T03:26:11Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。