論文の概要: Inverse Optimization Latent Variable Models for Learning Costs Applied to Route Problems
- arxiv url: http://arxiv.org/abs/2509.15999v1
- Date: Fri, 19 Sep 2025 14:10:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.193899
- Title: Inverse Optimization Latent Variable Models for Learning Costs Applied to Route Problems
- Title(参考訳): 経路問題に適用した学習コストの逆最適化潜在変数モデル
- Authors: Alan A. Lahoud, Erik Schaffernicht, Johannes A. Stork,
- Abstract要約: 観測された解からCOPコスト関数の潜在空間を学習する逆最適化潜在変数モデル(IO-LVM)を提案する。
本手法は, 船舶およびタクシーの航路の実際のデータセットと, 合成グラフの経路について検証する。
- 参考スコア(独自算出の注目度): 4.836546574465436
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning representations for solutions of constrained optimization problems (COPs) with unknown cost functions is challenging, as models like (Variational) Autoencoders struggle to enforce constraints when decoding structured outputs. We propose an Inverse Optimization Latent Variable Model (IO-LVM) that learns a latent space of COP cost functions from observed solutions and reconstructs feasible outputs by solving a COP with a solver in the loop. Our approach leverages estimated gradients of a Fenchel-Young loss through a non-differentiable deterministic solver to shape the latent space. Unlike standard Inverse Optimization or Inverse Reinforcement Learning methods, which typically recover a single or context-specific cost function, IO-LVM captures a distribution over cost functions, enabling the identification of diverse solution behaviors arising from different agents or conditions not available during the training process. We validate our method on real-world datasets of ship and taxi routes, as well as paths in synthetic graphs, demonstrating its ability to reconstruct paths and cycles, predict their distributions, and yield interpretable latent representations.
- Abstract(参考訳): 制約付き最適化問題(COP)と未知のコスト関数の解の学習は、(変数)オートエンコーダのようなモデルが、構造化された出力を復号する際に制約を強制するのに苦労するため、困難である。
提案する逆最適化潜時変動モデル (IO-LVM) は、観測された解からCOPコスト関数の潜時空間を学習し、ループ内の解法でCOPを解くことで実現可能な出力を再構築する。
我々の手法は、微分不可能な決定論的解法を通したフェンシェル・ヤング損失の推定勾配を利用して、潜在空間を形作る。
通常、単一あるいはコンテキスト固有のコスト関数を回復する標準的な逆最適化や逆強化学習法とは異なり、IO-LVMはコスト関数上の分布をキャプチャし、トレーニングプロセス中に利用できないさまざまなエージェントや条件から生じる多様なソリューションの振る舞いを識別する。
提案手法は,実世界の船舶・タクシー経路のデータセット,および合成グラフの経路について検証し,経路や周期を再構築し,分布を予測し,解釈可能な潜在表現を生成する能力を示す。
関連論文リスト
- TACO: Think-Answer Consistency for Optimized Long-Chain Reasoning and Efficient Data Learning via Reinforcement Learning in LVLMs [50.820065021136024]
DeepSeek R1には、大規模言語モデル(LLM)のためのかなり高度な複雑な推論がある。
最近の手法は、R1の推論能力をマルチモーダルな設定で再現しようと試みている。
視覚推論のための新しい強化学習アルゴリズムTACOを提案する。
論文 参考訳(メタデータ) (2025-05-27T06:30:48Z) - Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:47:00Z) - Towards Constraint-Based Adaptive Hypergraph Learning for Solving Vehicle Routing: An End-to-End Solution [4.965709007367529]
車両の経路問題は、広大な解空間と複雑な制約によって特徴づけられる。
本研究では,制約指向のハイパーグラフと強化学習を組み合わせた新しいエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-13T14:42:44Z) - From approximation error to optimality gap -- Explaining the performance impact of opportunity cost approximation in integrated demand management and vehicle routing [0.0]
本稿では,近似誤差の大きさ,即時の影響,および状態空間の特定の領域におけるそれらの関連性を定量化し,可視化する説明可能性手法を提案する。
本手法を一般のi-DMVRPに適用することにより,アルゴリズム性能の説明に寄与し,アルゴリズムの選択と開発プロセスのガイダンスを提供する。
論文 参考訳(メタデータ) (2024-12-18T13:46:46Z) - Amortized Posterior Sampling with Diffusion Prior Distillation [55.03585818289934]
Amortized Posterior Smplingは、逆問題における効率的な後方サンプリングのための新しい変分推論手法である。
本手法は,拡散モデルにより暗黙的に定義された変動分布と後続分布とのばらつきを最小限に抑えるために条件付き流れモデルを訓練する。
既存の手法とは異なり、我々のアプローチは教師なしであり、ペア化されたトレーニングデータを必要としておらず、ユークリッドと非ユークリッドの両方のドメインに適用できる。
論文 参考訳(メタデータ) (2024-07-25T09:53:12Z) - Stable Inverse Reinforcement Learning: Policies from Control Lyapunov Landscapes [4.229902091180109]
実験データからリアプノフ関数を学習するための新しい安定度認証IRL手法を提案する。
関連する制御ポリシーのクローズドフォーム表現を利用することで、CLFの空間を効率的に探索することができる。
我々は,CLFが提供する最適性に関する理論的解析を行い,シミュレーションデータと実世界データの両方を用いて我々のアプローチを評価する。
論文 参考訳(メタデータ) (2024-05-14T16:40:45Z) - Amortizing intractable inference in large language models [56.92471123778389]
難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。
我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。
重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文 参考訳(メタデータ) (2023-10-06T16:36:08Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - A framework for data-driven solution and parameter estimation of PDEs
using conditional generative adversarial networks [1.339230763466954]
この研究は、条件付き生成逆数ネットワーク(cGAN)に基づく画像から画像への変換の概念を初めて採用し、適応させたものである。
異種多孔質媒体における結合水-機械的プロセスの定常解に着目する。
論文 参考訳(メタデータ) (2021-05-27T13:30:17Z) - Joint learning of variational representations and solvers for inverse
problems with partially-observed data [13.984814587222811]
本稿では,教師付き環境において,逆問題に対する実際の変分フレームワークを学習するためのエンドツーエンドフレームワークを設計する。
変動コストと勾配に基づく解法はどちらも、後者の自動微分を用いたニューラルネットワークとして記述される。
これにより、データ駆動による変分モデルの発見につながる。
論文 参考訳(メタデータ) (2020-06-05T19:53:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。