論文の概要: A Machine Learning Approach to Solving Large Bilevel and Stochastic
Programs: Application to Cycling Network Design
- arxiv url: http://arxiv.org/abs/2209.09404v2
- Date: Tue, 3 Oct 2023 03:28:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 11:11:17.894040
- Title: A Machine Learning Approach to Solving Large Bilevel and Stochastic
Programs: Application to Cycling Network Design
- Title(参考訳): 大規模プログラムと確率プログラムを解く機械学習アプローチ:サイクリングネットワーク設計への応用
- Authors: Timothy C. Y. Chan, Bo Lin, Shoshanna Saxe
- Abstract要約: 我々は、多数の独立したフォロワーを含むバイレベルプログラムを解決するための、機械学習に基づく新しいアプローチを提案する。
機械学習モデルを用いて、アンサンプされたフォロワーの客観的な価値を推定する。
我々のアプローチは、追従者の客観的価値をより正確に予測し、さらに重要なのは、より高い品質のリーダー決定を生成することです。
- 参考スコア(独自算出の注目度): 4.599618895656792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel machine learning-based approach to solving bilevel
programs that involve a large number of independent followers, which as a
special case include two-stage stochastic programming. We propose an
optimization model that explicitly considers a sampled subset of followers and
exploits a machine learning model to estimate the objective values of unsampled
followers. Unlike existing approaches, we embed machine learning model training
into the optimization problem, which allows us to employ general follower
features that can not be represented using leader decisions. We prove bounds on
the optimality gap of the generated leader decision as measured by the original
objective function that considers the full follower set. We then develop
follower sampling algorithms to tighten the bounds and a representation
learning approach to learn follower features, which can be used as inputs to
the embedded machine learning model. Using synthetic instances of a cycling
network design problem, we compare the computational performance of our
approach versus baseline methods. Our approach provides more accurate
predictions for follower objective values, and more importantly, generates
leader decisions of higher quality. Finally, we perform a real-world case study
on cycling infrastructure planning, where we apply our approach to solve a
network design problem with over one million followers. Our approach presents
favorable performance compared to the current cycling network expansion
practices.
- Abstract(参考訳): 本稿では,2段階確率計画を含む,多数の独立系フォロワーを含むバイレベルプログラムを解決するための,機械学習に基づく新しい手法を提案する。
本研究では,フォロワーのサンプリングされたサブセットを明示的に考慮し,機械学習モデルを用いて非サンプリングフォロワーの客観的値を推定する最適化モデルを提案する。
既存のアプローチとは異なり、機械学習モデルのトレーニングを最適化問題に組み込むことで、リーダー決定で表現できない一般的なフォロワー機能を利用することができます。
我々は、全従者集合を考える元の目的関数によって測定される生成したリーダー決定の最適性ギャップの境界を証明する。
次に,境界を厳格化するためのフォロワサンプリングアルゴリズムと,組込み機械学習モデルへの入力として使用できるフォロワ特徴を学習するための表現学習手法を開発した。
サイクリングネットワーク設計問題の合成例を用いて,本手法の計算性能とベースライン法との比較を行った。
我々のアプローチは、フォロー対象の値に対するより正確な予測を提供し、さらに重要なことに、より高い品質のリーダー決定を生成する。
最後に、サイクリングインフラ計画の現実的なケーススタディを行い、100万人以上のフォロワーを持つネットワーク設計問題を解決するために我々のアプローチを適用します。
提案手法は,現在のサイクリングネットワーク拡張方式と比較して,良好な性能を示す。
関連論文リスト
- Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.86576388991713]
正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文 参考訳(メタデータ) (2024-10-29T14:41:44Z) - Meta-Learning from Learning Curves for Budget-Limited Algorithm Selection [11.409496019407067]
予算制限のシナリオでは、アルゴリズム候補を慎重に選択し、それを訓練するための予算を割り当てることが不可欠である。
本稿では,エージェントが十分に訓練されるまで待たずに,最も有望なアルゴリズムを学習する過程において,エージェントが選択しなければならない新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-10-10T08:09:58Z) - Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.15914284008973]
我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。
提案アルゴリズムはIRL問題の定常解に収束することを示す。
その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文 参考訳(メタデータ) (2024-05-28T07:11:05Z) - Advantages of Machine Learning in Bus Transport Analysis [0.0]
教師付き機械学習アルゴリズムを用いて,テヘランBRTバスシステムの周期性に寄与する要因を解析する。
所定時間帯の性能基準を満たすバス経路を予測できる正確なモデルを構築した。
論文 参考訳(メタデータ) (2023-10-16T13:02:43Z) - Let's reward step by step: Step-Level reward model as the Navigators for
Reasoning [64.27898739929734]
Process-Supervised Reward Model (PRM)は、トレーニングフェーズ中にステップバイステップのフィードバックをLLMに提供する。
LLMの探索経路を最適化するために,PRMからのステップレベルのフィードバックを応用した欲求探索アルゴリズムを提案する。
提案手法の汎用性を探るため,コーディングタスクのステップレベル報酬データセットを自動生成する手法を開発し,コード生成タスクにおける同様の性能向上を観察する。
論文 参考訳(メタデータ) (2023-10-16T05:21:50Z) - Probabilistic Bilevel Coreset Selection [24.874967723659022]
本稿では,各トレーニングサンプルの確率的重みを学習することにより,コアセット選択の連続確率的2レベル定式化を提案する。
暗黙的な微分の問題を伴わずに、偏りのない政策勾配を経由し、二段階最適化問題に対する効率的な解法を開発する。
論文 参考訳(メタデータ) (2023-01-24T09:37:00Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - Unsupervised Learning for Combinatorial Optimization with Principled
Objective Relaxation [19.582494782591386]
本研究は,最適化(CO)問題に対する教師なし学習フレームワークを提案する。
我々の重要な貢献は、緩和された目的がエントリーワイドな凹凸を満たすならば、低い最適化損失は最終積分解の品質を保証するという観察である。
特に、この観察は、対象が明示的に与えられていないアプリケーションにおいて、事前にモデル化される必要がある場合に、対象モデルの設計を導くことができる。
論文 参考訳(メタデータ) (2022-07-13T06:44:17Z) - Learning Curves for Decision Making in Supervised Machine Learning -- A
Survey [9.994200032442413]
学習曲線は、機械学習の文脈で採用されている社会科学の概念である。
本稿では,学習曲線のアプローチを3つの基準を用いて分類する枠組みを提案する。
論文 参考訳(メタデータ) (2022-01-28T14:34:32Z) - Learning Connectivity-Maximizing Network Configurations [123.01665966032014]
本稿では、専門家からコミュニケーションエージェントを配置することを学ぶ畳み込みニューラルネットワーク(CNN)を用いた教師あり学習手法を提案する。
我々は,標準ライントポロジやリングトポロジ,ランダムに生成された105万件のテストケース,トレーニング中に見えない大規模なチームについて,CNNのパフォーマンスを実証した。
トレーニング後,本システムは10~20名のエージェントの最適化手法よりも2桁高速な接続構成を生成する。
論文 参考訳(メタデータ) (2021-12-14T18:59:01Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。