Fugu-MT 論文翻訳(概要): Machine Learning-Augmented Optimization of Large Bilevel and Two-stage Stochastic Programs: Application to Cycling Network Design

論文の概要: Machine Learning-Augmented Optimization of Large Bilevel and Two-stage Stochastic Programs: Application to Cycling Network Design

arxiv url: http://arxiv.org/abs/2209.09404v3
Date: Mon, 1 Apr 2024 02:02:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-04 14:21:15.334612
Title: Machine Learning-Augmented Optimization of Large Bilevel and Two-stage Stochastic Programs: Application to Cycling Network Design
Title（参考訳）: 大規模2段階確率プログラムの機械学習による最適化:サイクリングネットワーク設計への応用
Authors: Timothy C. Y. Chan, Bo Lin, Shoshanna Saxe,
Abstract要約: 我々は、多数の独立したフォロワーを持つバイレベルプログラムを解くための機械学習アプローチを提案する。機械学習モデルを用いて、アンサンプされたフォロワーの客観的な価値を推定する。現在の慣行と比較して、我々の手法は輸送距離を19.2%改善し、1800万ドルのコスト削減につながる可能性がある。
参考スコア（独自算出の注目度）: 4.092552518040045
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Motivated by a cycling infrastructure planning application, we present a machine learning approach to solving bilevel programs with a large number of independent followers, which as a special case includes two-stage stochastic programming. We propose an optimization model that explicitly considers a sampled subset of followers and exploits a machine learning model to estimate the objective values of unsampled followers. Unlike existing approaches, we embed machine learning model training into the optimization problem, which allows us to employ follower features that cannot be represented using leader decisions. We prove bounds on the optimality gap of the generated leader decision as measured by the original objective that considers the full follower set. We develop follower sampling algorithms to tighten the bounds and a representation learning approach to learn follower features, which are used as inputs to our machine learning model. Through numerical studies, we show that our approach generates leader decisions of higher quality compared to baselines. Finally, we perform a real-world case study in Toronto, Canada, where we solve a cycling network design problem with over one million followers. Compared to the current practice, our approach improves a transportation metric by 19.2% and can lead to a potential cost saving of $18M.
Abstract（参考訳）: サイクリング・インフラストラクチャ・プランニング・アプリケーションによってモチベーションを得て,2段階確率計画を含む,多数の独立したフォロワーを持つバイレベル・プログラムを解くための機械学習手法を提案する。本研究では、フォロワーのサンプル部分集合を明示的に考慮し、機械学習モデルを用いてアンサンプされたフォロワーの客観的値を推定する最適化モデルを提案する。既存のアプローチとは異なり、機械学習モデルのトレーニングを最適化問題に組み込むことで、リーダの決定で表現できないフォローア機能を採用できます。我々は、生成したリーダー決定の最適性ギャップについて、全従者集合を考慮した当初の目的によって測定された境界を証明した。我々は,従者サンプリングアルゴリズムを開発し,従者の特徴を学習するための表現学習手法を開発し,機械学習モデルへの入力として利用する。数値解析により,本手法はベースラインよりも高い品質のリーダー決定を導出することを示す。最後に、カナダのトロントで実際のケーススタディを行い、100万人以上のフォロワーでサイクリングネットワークの設計問題を解決する。現在の慣行と比較して、我々の手法は輸送距離を19.2%改善し、1800万ドルのコスト削減につながる可能性がある。

関連論文リスト

UPath: Universal Planner Across Topological Heterogeneity For Grid-Based Pathfinding [43.22339935902436]
本研究では,タスクを一般化できるモデルの設計により,普遍的な予測器を設計することで,このギャップを埋める。我々の経験的アプローチは、A*の計算労力を2.2倍に縮める一方で、平均係数2.2の3%以内の解を提供することを示唆している。
論文参考訳（メタデータ） (2026-02-27T08:34:56Z)
Learning to Refine: Self-Refinement of Parallel Reasoning in LLMs [102.48588475875749]
本稿では,新しい並列テスト時間スケーリングフレームワークであるGenerative Self-Refinement (GSR)を紹介する。 GSRは一連の候補応答を並列に生成し、その後自己精製を行い、新しい優れた解を合成する。提案手法は,5つの数学ベンチマークにおいて,最先端性能を実現する。
論文参考訳（メタデータ） (2025-08-27T06:51:48Z)
Training Long-Context, Multi-Turn Software Engineering Agents with Reinforcement Learning [31.540626068273014]
我々はQwen2.5-72B-Instructに基づくエージェントを訓練し、実世界のソフトウェア工学の課題を解決する。提案手法は,SWE-bench Verifiedベンチマークにおけるエージェントの成功率を20%の微調整ベースラインから39%に向上させる。
論文参考訳（メタデータ） (2025-08-05T14:30:47Z)
Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.86576388991713]
正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文参考訳（メタデータ） (2024-10-29T14:41:44Z)
Meta-Learning from Learning Curves for Budget-Limited Algorithm Selection [11.409496019407067]
予算制限のシナリオでは、アルゴリズム候補を慎重に選択し、それを訓練するための予算を割り当てることが不可欠である。本稿では,エージェントが十分に訓練されるまで待たずに,最も有望なアルゴリズムを学習する過程において,エージェントが選択しなければならない新しい枠組みを提案する。
論文参考訳（メタデータ） (2024-10-10T08:09:58Z)
Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.15914284008973]
我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。提案アルゴリズムはIRL問題の定常解に収束することを示す。その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文参考訳（メタデータ） (2024-05-28T07:11:05Z)
Advantages of Machine Learning in Bus Transport Analysis [0.0]
教師付き機械学習アルゴリズムを用いて,テヘランBRTバスシステムの周期性に寄与する要因を解析する。所定時間帯の性能基準を満たすバス経路を予測できる正確なモデルを構築した。
論文参考訳（メタデータ） (2023-10-16T13:02:43Z)
Let's reward step by step: Step-Level reward model as the Navigators for Reasoning [64.27898739929734]
Process-Supervised Reward Model (PRM)は、トレーニングフェーズ中にステップバイステップのフィードバックをLLMに提供する。 LLMの探索経路を最適化するために,PRMからのステップレベルのフィードバックを応用した欲求探索アルゴリズムを提案する。提案手法の汎用性を探るため,コーディングタスクのステップレベル報酬データセットを自動生成する手法を開発し,コード生成タスクにおける同様の性能向上を観察する。
論文参考訳（メタデータ） (2023-10-16T05:21:50Z)
Graph Reinforcement Learning for Network Control via Bi-Level Optimization [37.00510744883984]
我々は、データ駆動戦略がこのプロセスを自動化し、最適性を損なうことなく効率的なアルゴリズムを学習できると主張している。我々は、強化学習のレンズを通してネットワーク制御の問題を提示し、幅広い問題に対処するグラフネットワークベースのフレームワークを提案する。
論文参考訳（メタデータ） (2023-05-16T03:20:22Z)
A hybrid deep-learning-metaheuristic framework for bi-level network design problems [2.741266294612776]
本研究では,道路ネットワーク設計問題(NDP)のための双方向アーキテクチャを用いたハイブリッドディープラーニング・メタヒューリスティックフレームワークを提案する。我々は、ユーザ均衡(UE)トラフィック割り当て問題の解を近似するために、グラフニューラルネットワーク(GNN)を訓練する。遺伝的アルゴリズム(GA)の適合度関数評価の計算にトレーニングモデルを用いて,NDPの解を近似する。
論文参考訳（メタデータ） (2023-03-10T16:23:56Z)
Probabilistic Bilevel Coreset Selection [24.874967723659022]
本稿では,各トレーニングサンプルの確率的重みを学習することにより,コアセット選択の連続確率的2レベル定式化を提案する。暗黙的な微分の問題を伴わずに、偏りのない政策勾配を経由し、二段階最適化問題に対する効率的な解法を開発する。
論文参考訳（メタデータ） (2023-01-24T09:37:00Z)
TransPath: Learning Heuristics For Grid-Based Pathfinding via Transformers [64.88759709443819]
探索の効率を顕著に向上させると考えられる,インスタンス依存のプロキシを学習することを提案する。私たちが最初に学ぶことを提案するプロキシは、補正係数、すなわち、インスタンスに依存しないコスト・ツー・ゴの見積もりと完璧な見積もりの比率である。第2のプロキシはパス確率であり、グリッドセルが最も短いパスに横たわっている可能性を示している。
論文参考訳（メタデータ） (2022-12-22T14:26:11Z)
CLUTR: Curriculum Learning via Unsupervised Task Representation Learning [130.79246770546413]
CLUTRは、タスク表現とカリキュラム学習を2段階最適化に分離する、新しいカリキュラム学習アルゴリズムである。 CLUTRは、CarRacingとナビゲーション環境における一般化とサンプル効率の観点から、原則的かつ一般的なUED手法であるPAIREDよりも優れていることを示す。
論文参考訳（メタデータ） (2022-10-19T01:45:29Z)
Towards Automated Imbalanced Learning with Deep Hierarchical Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文参考訳（メタデータ） (2022-08-26T04:28:01Z)
Unsupervised Learning for Combinatorial Optimization with Principled Objective Relaxation [19.582494782591386]
本研究は,最適化(CO)問題に対する教師なし学習フレームワークを提案する。我々の重要な貢献は、緩和された目的がエントリーワイドな凹凸を満たすならば、低い最適化損失は最終積分解の品質を保証するという観察である。特に、この観察は、対象が明示的に与えられていないアプリケーションにおいて、事前にモデル化される必要がある場合に、対象モデルの設計を導くことができる。
論文参考訳（メタデータ） (2022-07-13T06:44:17Z)
Communication-Efficient Robust Federated Learning with Noisy Labels [144.31995882209932]
フェデレーテッド・ラーニング(FL)は、分散した位置データの上で、将来性のあるプライバシ保護機械学習パラダイムである。 FLにおける雑音ラベルの効果を緩和する学習に基づく再重み付け手法を提案する。提案手法は,複数の実世界のデータセットにおいて,各種ベースラインと比較して優れた性能を示した。
論文参考訳（メタデータ） (2022-06-11T16:21:17Z)
Local Stochastic Bilevel Optimization with Momentum-Based Variance Reduction [104.41634756395545]
具体的には、まず、決定論的勾配に基づくアルゴリズムであるFedBiOを提案する。 FedBiOの複雑性は$O(epsilon-1.5)$である。本アルゴリズムは数値実験において,他のベースラインと比較して優れた性能を示す。
論文参考訳（メタデータ） (2022-05-03T16:40:22Z)
Learning Curves for Decision Making in Supervised Machine Learning -- A Survey [9.994200032442413]
学習曲線は、機械学習の文脈で採用されている社会科学の概念である。本稿では,学習曲線のアプローチを3つの基準を用いて分類する枠組みを提案する。
論文参考訳（メタデータ） (2022-01-28T14:34:32Z)
Learning Connectivity-Maximizing Network Configurations [123.01665966032014]
本稿では、専門家からコミュニケーションエージェントを配置することを学ぶ畳み込みニューラルネットワーク(CNN)を用いた教師あり学習手法を提案する。我々は,標準ライントポロジやリングトポロジ,ランダムに生成された105万件のテストケース,トレーニング中に見えない大規模なチームについて,CNNのパフォーマンスを実証した。トレーニング後,本システムは10～20名のエージェントの最適化手法よりも2桁高速な接続構成を生成する。
論文参考訳（メタデータ） (2021-12-14T18:59:01Z)
Improved Bilevel Model: Fast and Optimal Algorithm with Theoretical Guarantee [110.16183719936629]
本稿では,現行の定式化よりも高速に収束する2レベルモデルを提案する。実験結果から,本モデルが現行のバイレベルモデルよりも大きなマージンで優れていたことが示唆された。
論文参考訳（メタデータ） (2020-09-01T20:52:57Z)
Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文参考訳（メタデータ） (2020-06-15T10:08:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。