Fugu-MT 論文翻訳(概要): Hierarchical Evaluation Function: A Multi-Metric Approach for Optimizing Demand Forecasting Models

論文の概要: Hierarchical Evaluation Function: A Multi-Metric Approach for Optimizing Demand Forecasting Models

arxiv url: http://arxiv.org/abs/2508.13057v2
Date: Mon, 01 Sep 2025 19:54:14 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-03 14:24:52.631044
Title: Hierarchical Evaluation Function: A Multi-Metric Approach for Optimizing Demand Forecasting Models
Title（参考訳）: 階層的評価関数:需要予測モデル最適化のためのマルチメトリックアプローチ
Authors: Adolfo González, Víctor Parada,
Abstract要約: 階層的評価関数(Hierarchical Evaluation Function, HEF)は、R2, MAE, RMSEを階層的および動的フレームワークに統合する複合関数である。 HEFは、R2、Global Relative Precision、RMSE、RMSSEといったグローバルメトリクスにおいて、評価関数として使われるMAEを一貫して上回っている。
参考スコア（独自算出の注目度）: 0.479839492673697
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Inventory management in dynamic and competitive business environments presents multidimensional challenges, particularly in the face of demand uncertainty and logistical and financial constraints. In this context, accurate demand forecasting is critical for optimizing resources and anticipating market fluctuations. However, the isolated use of traditional metrics such as Mean Absolute Error (MAE) or Root Mean Squared Error (RMSE) can lead to biased evaluations and limit model robustness. To address this limitation, we propose the Hierarchical Evaluation Function (HEF), a composite function that integrates R2, MAE, and RMSE under a hierarchical and dynamic framework, complemented by adaptive penalties. The study implements HEF in the optimization of multiple prediction models, applying Grid Search, Particle Swarm Optimization (PSO), and Optuna, and evaluating their performance on reference databases (Walmart, M3, M4, and M5). The results, validated using statistical tests, confirm that HEF consistently outperforms the MAE used as the evaluation function in global metrics such as R2, Global Relative Precision, RMSE, and RMSSE, improving explanatory power and stability against extreme errors. In contrast, the MAE retains advantages in simplicity and computational efficiency. In summary, HEF constitutes a robust and adaptive alternative for highly variable environments, providing a solid framework for model selection and hyperparameter optimization.
Abstract（参考訳）: 動的かつ競争的なビジネス環境における在庫管理は、特に需要の不確実性や物流や財務上の制約に直面して、多次元的な課題を提起する。この文脈では、資源の最適化と市場の変動を予測するために、正確な需要予測が重要である。しかし、Mean Absolute Error (MAE) や Root Mean Squared Error (RMSE) のような伝統的なメトリクスの孤立した使用は、バイアス付き評価とモデルロバスト性を制限する可能性がある。この制限に対処するために,R2, MAE, RMSEを階層的かつ動的に統合し,適応的な罰則を補完する複合関数である階層的評価関数(HEF)を提案する。この研究は、複数の予測モデルの最適化、Grid Search、Particle Swarm Optimization (PSO)、Optunaの適用、参照データベース(Walmart、M3、M4、M5)の性能評価において、HEFを実装している。その結果,HEFは,R2,Global Relative Precision,RMSE,RMSSEなどの大域的指標において,評価関数として使用するMAEを一貫して上回り,説明力や極端なエラーに対する安定性が向上していることが確認された。対照的に、MAEは単純さと計算効率の利点を保っている。要約すると、HEFは高可変環境に対する堅牢で適応的な代替手段であり、モデル選択とハイパーパラメータ最適化のための確かなフレームワークを提供する。

関連論文リスト

Echo State Networks for Time Series Forecasting: Hyperparameter Sweep and Benchmarking [51.56484100374058]
我々は、完全に自動で純粋にフィードバック駆動のESNが、広く使われている統計的予測手法の代替となるかどうかを評価する。予測精度は、MASEとsMAPEを用いて測定され、ドリフトや季節予測、統計モデルといった単純なベンチマークと比較される。
論文参考訳（メタデータ） (2026-02-03T16:01:22Z)
AWPO: Enhancing Tool-Use of Large Language Models through Explicit Integration of Reasoning Rewards [60.2998874976509]
我々は,ツール利用能力を高めるために,明示的な推論報酬を統合するために,有利なポリシー最適化(AWPO)を提案する。 AWPOは分散認識ゲーティングと困難認識重み付けを導入し、推論信号から利点を適応的に変調する。実験により、AWPOは標準的なツール使用ベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2025-12-22T08:07:00Z)
Km-scale dynamical downscaling through conformalized latent diffusion models [45.94979929172337]
高分解能気象場を粗大なシミュレーションから導き出すためには, 動的ダウンスケーリングが不可欠である。 Generative Diffusion Model(DM)は、最近、このタスクのための強力なデータ駆動ツールとして登場した。しかし、DMは過信予測に対する有限サンプル保証を欠いているため、グリッドポイントレベルの不確実性推定が誤って行われる。我々は、コンフォーマルな予測フレームワークでダウンスケーリングパイプラインを拡張することで、この問題に対処する。
論文参考訳（メタデータ） (2025-10-15T08:41:36Z)
CALM Before the STORM: Unlocking Native Reasoning for Optimization Modeling [60.55856973678002]
大規模推論モデル (LRM) は、複雑な多段階推論において強力な機能を示した。既存のドメイン適応手法は、元々は命令調整モデル用に設計されていたが、現代のLEMの高度な推論パターンをうまく利用できなかった。我々は、最適化モデリングタスクのためのネイティブ推論モード内でのLEMを段階的に洗練するフレームワークである textbfCALM を提案する。
論文参考訳（メタデータ） (2025-10-05T13:38:31Z)
Locally Adaptive Conformal Inference for Operator Models [5.78532405664684]
演算子モデルに対して関数値の局所適応予測セットを生成するための分散フリーフレームワークであるLocal Sliced Conformal Inference (LSCI)を紹介する。我々は有限サンプルの有効性を証明し、局所交換性の下でのカバレッジギャップにデータ依存の上限を導出する。偏りのある予測や分布外雑音に対する空間を実証的に実証する。
論文参考訳（メタデータ） (2025-07-28T16:37:56Z)
Divergence Minimization Preference Optimization for Diffusion Model Alignment [58.651951388346525]
Divergence Minimization Preference Optimization (DMPO) は、逆KL分散を最小化して拡散モデルを整列する原理的手法である。その結果,DMPOで微調整した拡散モデルは,既存の手法よりも常に優れるか,一致しているかが示唆された。 DMPOは、優先順位調整のための堅牢でエレガントな経路を解き、拡散モデルにおいて実用的な性能を持つ原理的理論をブリッジする。
論文参考訳（メタデータ） (2025-07-10T07:57:30Z)
Can Time-Series Foundation Models Perform Building Energy Management Tasks? [5.450531952940644]
エネルギー管理タスクを構築するには、さまざまな時系列データからの処理と学習が必要である。既存のソリューションは、これらのタスクを実行するために、bespokeタスクとデータ固有のモデルに依存しています。 LLM(Large Language Models)の変革的な成功に触発されて、TSFM(Time-Series Foundation Models)は、これを変える可能性を秘めている。
論文参考訳（メタデータ） (2025-06-12T19:45:10Z)
Feasible Learning [78.6167929413604]
本稿では,サンプル中心の学習パラダイムであるFeasible Learning(FL)を紹介する。大規模言語モデルにおける画像分類, 年齢回帰, 好みの最適化といった経験的分析により, FLを用いて訓練したモデルでは, 平均的性能に限界があるものの, ERMと比較して改善された尾の挙動を示しながらデータから学習できることが実証された。
論文参考訳（メタデータ） (2025-01-24T20:39:38Z)
QGAPHEnsemble : Combining Hybrid QLSTM Network Ensemble via Adaptive Weighting for Short Term Weather Forecasting [0.0]
本研究は,高度な機械学習技術を用いた実践的有効性を強調した。本モデルでは,気象予測の精度と信頼性が大幅に向上したことを示す。本稿では,天気予報タスクの性能向上のために,最適化アンサンブル技術の重要性を強調した。
論文参考訳（メタデータ） (2025-01-18T20:18:48Z)
Local vs. Global Models for Hierarchical Forecasting [0.0]
本研究では,情報活用が階層的予測の精度に与える影響について検討する。我々は,クロスシリーズとクロス階層情報を活用するために,グローバル予測モデル(GFM)を開発した。 LightGBM に基づく2つの特定の GFM が導入された。
論文参考訳（メタデータ） (2024-11-10T08:51:49Z)
MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文参考訳（メタデータ） (2024-10-12T07:02:33Z)
On ADMM in Heterogeneous Federated Learning: Personalization, Robustness, and Fairness [16.595935469099306]
本稿では,乗算器の交互方向法(ADMM)を利用して,パーソナライズおよびグローバルモデルの学習を行う最適化フレームワークFLAMEを提案する。我々の理論的解析は、軽度の仮定の下で、FLAMEのグローバル収束と2種類の収束速度を確立する。実験の結果,FLAMEは収束と精度において最先端の手法より優れており,各種攻撃下では高い精度を達成できることがわかった。
論文参考訳（メタデータ） (2024-07-23T11:35:42Z)
Variational Inference of Parameters in Opinion Dynamics Models [9.51311391391997]
この研究は、変数推論を用いて、意見力学 ABM のパラメータを推定する。我々は推論プロセスを自動微分に適した最適化問題に変換する。提案手法は, シミュレーションベース法とMCMC法より, マクロ的(有界信頼区間とバックファイア閾値)と微視的(200ドル, エージェントレベルの役割)の両方を正確に推定する。
論文参考訳（メタデータ） (2024-03-08T14:45:18Z)
ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文参考訳（メタデータ） (2024-02-02T10:34:13Z)
Comparative Evaluation of Metaheuristic Algorithms for Hyperparameter Selection in Short-Term Weather Forecasting [0.0]
本稿では,遺伝的アルゴリズム (GA), 微分進化 (DE), 粒子群最適化 (PSO) のメタヒューリスティックアルゴリズムの適用について検討する。平均二乗誤差(MSE)や平均絶対パーセンテージ誤差(MAPE)といった指標に基づいて天気予報の性能を評価する。
論文参考訳（メタデータ） (2023-09-05T22:13:35Z)
Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文参考訳（メタデータ） (2022-09-27T07:58:25Z)
Rectified Max-Value Entropy Search for Bayesian Optimization [54.26984662139516]
我々は、相互情報の概念に基づいて、修正されたMES取得関数を開発する。その結果、RMESは、いくつかの合成関数ベンチマークと実世界の最適化問題において、MESよりも一貫した改善を示している。
論文参考訳（メタデータ） (2022-02-28T08:11:02Z)
Providing reliability in Recommender Systems through Bernoulli Matrix Factorization [63.732639864601914]
本稿では,予測値と信頼性値の両方を提供するためにBernoulli Matrix Factorization (BeMF)を提案する。 BeMFはメモリベースのフィルタリングではなく、モデルベースの協調フィルタリングに作用する。予測の信頼性が高ければ高いほど、それが間違っているという責任は少なくなる。
論文参考訳（メタデータ） (2020-06-05T14:24:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。