Fugu-MT 論文翻訳(概要): Hierarchical Evaluation Function: A Multi-Metric Approach for Optimizing Demand Forecasting Models

論文の概要: Hierarchical Evaluation Function: A Multi-Metric Approach for Optimizing Demand Forecasting Models

arxiv url: http://arxiv.org/abs/2508.13057v4
Date: Tue, 23 Sep 2025 15:43:58 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-24 14:02:59.870281
Title: Hierarchical Evaluation Function: A Multi-Metric Approach for Optimizing Demand Forecasting Models
Title（参考訳）: 階層的評価関数:需要予測モデル最適化のためのマルチメトリックアプローチ
Authors: Adolfo González, Víctor Parada,
Abstract要約: 階層的評価関数(Hierarchical Evaluation Function、HEF)は、R2、MAE、RMSEを階層的かつ適応的なフレームワークに統合する複合関数である。 HEFは、R2、Global Relative Accuracy(GRA)、RMSE、RMSSEなどのグローバルメトリクスにおいて、MAEを評価関数として一貫して上回る。
参考スコア（独自算出の注目度）: 0.479839492673697
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Accurate demand forecasting is crucial for effective inventory management in dynamic and competitive environments, where decisions are influenced by uncertainty, financial constraints, and logistical limitations. Traditional evaluation metrics such as Mean Absolute Error (MAE) and Root Mean Squared Error (RMSE) provide complementary perspectives but may lead to biased assessments when applied individually. To address this limitation, we propose the Hierarchical Evaluation Function (HEF), a composite function that integrates R2, MAE, and RMSE within a hierarchical and adaptive framework. The function incorporates dynamic weights, tolerance thresholds derived from the statistical properties of the series, and progressive penalty mechanisms to ensure robustness against extreme errors and invalid predictions. HEF was implemented to optimize multiple forecasting models using Grid Search, Particle Swarm Optimization (PSO), and Optuna, and tested on benchmark datasets including Walmart, M3, M4, and M5. Experimental results, validated through statistical tests, demonstrate that HEF consistently outperforms MAE as an evaluation function in global metrics such as R2, Global Relative Accuracy (GRA), RMSE, and RMSSE, thereby providing greater explanatory power, adaptability, and stability. While MAE retains advantages in simplicity and efficiency, HEF proves more effective for long-term planning and complex contexts. Overall, HEF constitutes a robust and adaptive alternative for model selection and hyperparameter optimization in highly variable demand forecasting environments.
Abstract（参考訳）: 正確な需要予測は、不確実性、財政的制約、論理的制約によって決定が影響される、動的かつ競争的な環境における効果的な在庫管理に不可欠である。 Mean Absolute Error (MAE) や Root Mean Squared Error (RMSE) といった従来の評価指標は相補的な視点を提供するが、個別に適用するとバイアスのある評価につながる可能性がある。この制限に対処するために、階層的・適応的なフレームワークにR2, MAE, RMSEを統合する複合関数である階層的評価関数(HEF)を提案する。この関数には、動的重み、系列の統計的性質に由来する許容しきい値、極端なエラーや無効な予測に対する堅牢性を保証するプログレッシブペナルティ機構が含まれる。 HEFはGrid Search、Particle Swarm Optimization (PSO)、Optunaを使って複数の予測モデルを最適化するために実装され、Walmart、M3、M4、M5といったベンチマークデータセットでテストされた。実験結果から,HEFはR2,Global Relative Accuracy(GRA),RMSE,RMSSEなどの大域的指標において,MAEを一貫して上回り,説明力,適応性,安定性が向上することを示した。 MAEは単純さと効率性の利点を保っているが、HEFは長期計画や複雑なコンテキストにおいてより効果的であることが証明されている。全体として、HEFは需要予測環境におけるモデル選択とハイパーパラメータ最適化の頑健で適応的な代替手段となっている。

関連論文リスト

Echo State Networks for Time Series Forecasting: Hyperparameter Sweep and Benchmarking [51.56484100374058]
我々は、完全に自動で純粋にフィードバック駆動のESNが、広く使われている統計的予測手法の代替となるかどうかを評価する。予測精度は、MASEとsMAPEを用いて測定され、ドリフトや季節予測、統計モデルといった単純なベンチマークと比較される。
論文参考訳（メタデータ） (2026-02-03T16:01:22Z)
AWPO: Enhancing Tool-Use of Large Language Models through Explicit Integration of Reasoning Rewards [60.2998874976509]
我々は,ツール利用能力を高めるために,明示的な推論報酬を統合するために,有利なポリシー最適化(AWPO)を提案する。 AWPOは分散認識ゲーティングと困難認識重み付けを導入し、推論信号から利点を適応的に変調する。実験により、AWPOは標準的なツール使用ベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2025-12-22T08:07:00Z)
Km-scale dynamical downscaling through conformalized latent diffusion models [45.94979929172337]
高分解能気象場を粗大なシミュレーションから導き出すためには, 動的ダウンスケーリングが不可欠である。 Generative Diffusion Model(DM)は、最近、このタスクのための強力なデータ駆動ツールとして登場した。しかし、DMは過信予測に対する有限サンプル保証を欠いているため、グリッドポイントレベルの不確実性推定が誤って行われる。我々は、コンフォーマルな予測フレームワークでダウンスケーリングパイプラインを拡張することで、この問題に対処する。
論文参考訳（メタデータ） (2025-10-15T08:41:36Z)
CALM Before the STORM: Unlocking Native Reasoning for Optimization Modeling [60.55856973678002]
大規模推論モデル (LRM) は、複雑な多段階推論において強力な機能を示した。既存のドメイン適応手法は、元々は命令調整モデル用に設計されていたが、現代のLEMの高度な推論パターンをうまく利用できなかった。我々は、最適化モデリングタスクのためのネイティブ推論モード内でのLEMを段階的に洗練するフレームワークである textbfCALM を提案する。
論文参考訳（メタデータ） (2025-10-05T13:38:31Z)
Locally Adaptive Conformal Inference for Operator Models [5.78532405664684]
演算子モデルに対して関数値の局所適応予測セットを生成するための分散フリーフレームワークであるLocal Sliced Conformal Inference (LSCI)を紹介する。我々は有限サンプルの有効性を証明し、局所交換性の下でのカバレッジギャップにデータ依存の上限を導出する。偏りのある予測や分布外雑音に対する空間を実証的に実証する。
論文参考訳（メタデータ） (2025-07-28T16:37:56Z)
Divergence Minimization Preference Optimization for Diffusion Model Alignment [58.651951388346525]
Divergence Minimization Preference Optimization (DMPO) は、逆KL分散を最小化して拡散モデルを整列する原理的手法である。その結果,DMPOで微調整した拡散モデルは,既存の手法よりも常に優れるか,一致しているかが示唆された。 DMPOは、優先順位調整のための堅牢でエレガントな経路を解き、拡散モデルにおいて実用的な性能を持つ原理的理論をブリッジする。
論文参考訳（メタデータ） (2025-07-10T07:57:30Z)
Can Time-Series Foundation Models Perform Building Energy Management Tasks? [5.450531952940644]
エネルギー管理タスクを構築するには、さまざまな時系列データからの処理と学習が必要である。既存のソリューションは、これらのタスクを実行するために、bespokeタスクとデータ固有のモデルに依存しています。 LLM(Large Language Models)の変革的な成功に触発されて、TSFM(Time-Series Foundation Models)は、これを変える可能性を秘めている。
論文参考訳（メタデータ） (2025-06-12T19:45:10Z)
Feasible Learning [78.6167929413604]
本稿では,サンプル中心の学習パラダイムであるFeasible Learning(FL)を紹介する。大規模言語モデルにおける画像分類, 年齢回帰, 好みの最適化といった経験的分析により, FLを用いて訓練したモデルでは, 平均的性能に限界があるものの, ERMと比較して改善された尾の挙動を示しながらデータから学習できることが実証された。
論文参考訳（メタデータ） (2025-01-24T20:39:38Z)
QGAPHEnsemble : Combining Hybrid QLSTM Network Ensemble via Adaptive Weighting for Short Term Weather Forecasting [0.0]
本研究は,高度な機械学習技術を用いた実践的有効性を強調した。本モデルでは,気象予測の精度と信頼性が大幅に向上したことを示す。本稿では,天気予報タスクの性能向上のために,最適化アンサンブル技術の重要性を強調した。
論文参考訳（メタデータ） (2025-01-18T20:18:48Z)
Local vs. Global Models for Hierarchical Forecasting [0.0]
本研究では,情報活用が階層的予測の精度に与える影響について検討する。我々は,クロスシリーズとクロス階層情報を活用するために,グローバル予測モデル(GFM)を開発した。 LightGBM に基づく2つの特定の GFM が導入された。
論文参考訳（メタデータ） (2024-11-10T08:51:49Z)
MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文参考訳（メタデータ） (2024-10-12T07:02:33Z)
On ADMM in Heterogeneous Federated Learning: Personalization, Robustness, and Fairness [16.595935469099306]
本稿では,乗算器の交互方向法(ADMM)を利用して,パーソナライズおよびグローバルモデルの学習を行う最適化フレームワークFLAMEを提案する。我々の理論的解析は、軽度の仮定の下で、FLAMEのグローバル収束と2種類の収束速度を確立する。実験の結果,FLAMEは収束と精度において最先端の手法より優れており,各種攻撃下では高い精度を達成できることがわかった。
論文参考訳（メタデータ） (2024-07-23T11:35:42Z)
Variational Inference of Parameters in Opinion Dynamics Models [9.51311391391997]
この研究は、変数推論を用いて、意見力学 ABM のパラメータを推定する。我々は推論プロセスを自動微分に適した最適化問題に変換する。提案手法は, シミュレーションベース法とMCMC法より, マクロ的(有界信頼区間とバックファイア閾値)と微視的(200ドル, エージェントレベルの役割)の両方を正確に推定する。
論文参考訳（メタデータ） (2024-03-08T14:45:18Z)
ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.6987191099507]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。また,複数のランダムサンプルを用いて予測結果の不確かさをキャプチャするExBoosterについても紹介する。提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文参考訳（メタデータ） (2024-02-02T10:34:13Z)
Comparative Evaluation of Metaheuristic Algorithms for Hyperparameter Selection in Short-Term Weather Forecasting [0.0]
本稿では,遺伝的アルゴリズム (GA), 微分進化 (DE), 粒子群最適化 (PSO) のメタヒューリスティックアルゴリズムの適用について検討する。平均二乗誤差(MSE)や平均絶対パーセンテージ誤差(MAPE)といった指標に基づいて天気予報の性能を評価する。
論文参考訳（メタデータ） (2023-09-05T22:13:35Z)
Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文参考訳（メタデータ） (2022-09-27T07:58:25Z)
Rectified Max-Value Entropy Search for Bayesian Optimization [54.26984662139516]
我々は、相互情報の概念に基づいて、修正されたMES取得関数を開発する。その結果、RMESは、いくつかの合成関数ベンチマークと実世界の最適化問題において、MESよりも一貫した改善を示している。
論文参考訳（メタデータ） (2022-02-28T08:11:02Z)
Providing reliability in Recommender Systems through Bernoulli Matrix Factorization [63.732639864601914]
本稿では,予測値と信頼性値の両方を提供するためにBernoulli Matrix Factorization (BeMF)を提案する。 BeMFはメモリベースのフィルタリングではなく、モデルベースの協調フィルタリングに作用する。予測の信頼性が高ければ高いほど、それが間違っているという責任は少なくなる。
論文参考訳（メタデータ） (2020-06-05T14:24:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。