論文の概要: Scalable Decision Focused Learning via Online Trainable Surrogates
- arxiv url: http://arxiv.org/abs/2512.03861v1
- Date: Wed, 03 Dec 2025 15:09:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-04 20:02:55.340815
- Title: Scalable Decision Focused Learning via Online Trainable Surrogates
- Title(参考訳): オンライン学習可能なサロゲートによるスケーラブルな意思決定
- Authors: Gaetano Signorelli, Michele Lombardi,
- Abstract要約: コスト損失関数の評価を効率的な代理に置き換える高速化手法を提案する。
従来定義されていたサロゲートとは異なり、我々のアプローチは、急激な局所最適化のリスクを減らす不偏推定器に依存している。
提案手法は,他の最先端技術に匹敵するソリューション品質で,コストのかかる内部解決コールを削減する。
- 参考スコア(独自算出の注目度): 9.624413875440233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision support systems often rely on solving complex optimization problems that may require to estimate uncertain parameters beforehand. Recent studies have shown how using traditionally trained estimators for this task can lead to suboptimal solutions. Using the actual decision cost as a loss function (called Decision Focused Learning) can address this issue, but with a severe loss of scalability at training time. To address this issue, we propose an acceleration method based on replacing costly loss function evaluations with an efficient surrogate. Unlike previously defined surrogates, our approach relies on unbiased estimators reducing the risk of spurious local optima and can provide information on its local confidence allowing one to switch to a fallback method when needed. Furthermore, the surrogate is designed for a black-box setting, which enables compensating for simplifications in the optimization model and account- ing for recourse actions during cost computation. In our results, the method reduces costly inner solver calls, with a solution quality comparable to other state-of-the-art techniques.
- Abstract(参考訳): 決定支援システムはしばしば、不確実なパラメータを事前に推定する必要がある複雑な最適化問題を解くことに依存する。
近年の研究では、このタスクに伝統的に訓練された推定器を用いることで、サブ最適解がもたらされることが示されている。
実際の意思決定コストを損失関数(Decision Focused Learningと呼ばれる)として使うと、この問題に対処できますが、トレーニング時にスケーラビリティが著しく失われます。
この問題に対処するため,コスト損失関数の評価を効率的なサロゲートに置き換える高速化手法を提案する。
従来定義されていたサロゲートとは違って,本手法では,局所的最適性のリスクを低減し,必要な時にフォールバック方式に切り替えることのできる,局所的信頼度に関する情報を提供する。
さらに、このサロゲートはブラックボックス設定のために設計されており、最適化モデルの単純化とコスト計算中のリコース動作の会計処理を補償することができる。
提案手法は,他の最先端技術に匹敵するソリューション品質で,コストのかかる内部解決コールを削減する。
関連論文リスト
- Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。
本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文 参考訳(メタデータ) (2025-12-23T03:10:09Z) - e1: Learning Adaptive Control of Reasoning Effort [88.51897900019485]
AIモデルの思考予算の増大は、精度を大幅に向上させるが、すべての質問が同じ量の推論を保証しているわけではない。
ユーザは、アウトプットの品質を、レイテンシやコストに対してどのように評価するかによって、さまざまな理由付けの労力を割り当てる傾向があります。
本稿では,ユーザが指定したトークン数を用いてモデルを学習する自己適応型強化学習手法であるAdaptive Effort Controlを提案する。
論文 参考訳(メタデータ) (2025-10-30T23:12:21Z) - Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems [2.365391421959969]
本稿では,関数エンコーダ (FE) ポリシを用いた最適制御問題の伝達可能な解を提案する。
提案手法は,制御ポリシ空間にまたがる再利用可能な神経基盤関数の集合を学習する。
様々な力学,次元,コスト構造に関する数値実験により,本手法が最小限のオーバーヘッドで最適に近い性能を実現することを示す。
論文 参考訳(メタデータ) (2025-09-22T20:38:05Z) - Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:47:00Z) - Learning Joint Models of Prediction and Optimization [56.04498536842065]
Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-07T19:52:14Z) - Memory-Enhanced Neural Solvers for Routing Problems [8.255381359612885]
本稿では、メモリを活用して推論時のニューラルソルバの探索を改善するアプローチであるMementOを提案する。
本研究は, ツリーサーチと政策段階の微調整よりも, 走行セールスマンとキャパシタント車両ルーティングの問題に有効性を示すものである。
我々は,大規模インスタンス上で全RL自動回帰解法をトレーニングし,MementOのスケーラビリティとデータ効率を検証した。
論文 参考訳(メタデータ) (2024-06-24T08:18:19Z) - Cost-Adaptive Recourse Recommendation by Adaptive Preference Elicitation [18.423687983628145]
アルゴリズムのリコースでは、被験者に対して、好ましくない機械学習の分類決定を逆転させるために、コスト効率のよいアクションを推奨する。
本稿では、リコース生成問題に嗜好学習を統合するための2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-23T03:27:17Z) - Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - Benchmarking PtO and PnO Methods in the Predictive Combinatorial Optimization Regime [59.27851754647913]
予測最適化(英: Predictive optimization)は、エネルギーコストを意識したスケジューリングや広告予算配分など、多くの現実世界のアプリケーションの正確なモデリングである。
我々は,広告のための新しい産業データセットを含む8つの問題に対して,既存のPtO/PnOメソッド11をベンチマークするモジュラーフレームワークを開発した。
本研究は,8ベンチマーク中7ベンチマークにおいて,PnOアプローチがPtOよりも優れていることを示すが,PnOの設計選択に銀の弾丸は見つからない。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - Landscape-Sketch-Step: An AI/ML-Based Metaheuristic for Surrogate
Optimization Problems [0.0]
コスト関数の広範囲な評価が高価で、アクセス不能、あるいは禁止されるシナリオにおいて、グローバルな最適化のための新しいアルゴリズムを導入する。
この手法はLandscape-Sketch-and-Step (LSS)と呼ばれ、機械学習、レプリカ最適化、強化学習技術を組み合わせたものである。
論文 参考訳(メタデータ) (2023-09-14T01:53:45Z) - Leaving the Nest: Going Beyond Local Loss Functions for
Predict-Then-Optimize [57.22851616806617]
本手法は,文献から得られた4つの領域において,最先端の成果が得られることを示す。
提案手法は, 局所性仮定が破られた場合, 既存手法よりも200%近く性能が向上する。
論文 参考訳(メタデータ) (2023-05-26T11:17:45Z) - Online Learning and Optimization for Queues with Unknown Demand Curve and Service Distribution [30.161078999605152]
サービス提供者が最適なサービス料金 p とサービス容量 mu を選択する待ち行列システムにおける最適化問題について検討する。
本研究では,パラメータ推定誤差を自動的に解法に組み込むオンライン学習フレームワークを開発した。
論文 参考訳(メタデータ) (2023-03-06T08:47:40Z) - Contrastive Losses and Solution Caching for Predict-and-Optimize [19.31153168397003]
ノイズコントラスト法を用いて、サロゲート損失関数の族を動機付ける。
すべての予測と最適化アプローチのボトルネックに対処する。
非常に遅い成長率でさえ、最先端の手法の質に合わせるのに十分であることを示す。
論文 参考訳(メタデータ) (2020-11-10T19:09:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。