論文の概要: The Capacity Constraint Physarum Solver
- arxiv url: http://arxiv.org/abs/2010.09280v1
- Date: Mon, 19 Oct 2020 07:46:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 21:59:45.275762
- Title: The Capacity Constraint Physarum Solver
- Title(参考訳): フィザラム溶液の容量制限
- Authors: Yusheng Huang (1), Dong Chu (2), Yong Deng (1), Kang Hao Cheong (3 and
4) ((1) Institute of Fundamental and Frontier Science, University of
Electronic Science and Technology of China, Chengdu, 610054, China, (2)
Schools of Information and Communication Engineering, University of
Electronic Science and Technology of China, Chengdu, 610054, China, (3)
Science, Mathematics and Technology Cluster, Singapore University of
Technology and Design (SUTD), S487372, Singapore, (4) SUTD-Massachusetts
Institute of Technology International Design Centre, Singapore)
- Abstract要約: PPA(Physarum polycephalum inspired algorithm)におけるリンクフローに対するキャパシティ制約を許容する新しい枠組みであるCPPA(Capacitated physarum polycephalum inspired algorithm)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Physarum polycephalum inspired algorithm (PPA), also known as the Physarum
Solver, has attracted great attention. By modelling real-world problems into a
graph with network flow and adopting proper equations to calculate the distance
between the nodes in the graph, PPA could be used to solve system optimization
problems or user equilibrium problems. However, some problems such as the
maximum flow (MF) problem, minimum-cost-maximum-flow (MCMF) problem, and
link-capacitated traffic assignment problem (CTAP), require the flow flowing
through links to follow capacity constraints. Motivated by the lack of related
PPA-based research, a novel framework, the capacitated physarum polycephalum
inspired algorithm (CPPA), is proposed to allow capacity constraints toward
link flow in the PPA. To prove the validity of the CPPA, we developed three
applications of the CPPA, i.e., the CPPA for the MF problem (CPPA-MF), the CPPA
for the MCFC problem, and the CPPA for the link-capacitated traffic assignment
problem (CPPA-CTAP). In the experiments, all the applications of the CPPA solve
the problems successfully. Some of them demonstrate efficiency compared to the
baseline algorithms. The experimental results prove the validation of using the
CPPA framework to control link flow in the PPA is valid. The CPPA is also very
robust and easy to implement since it could be successfully applied in three
different scenarios. The proposed method shows that: having the ability to
control the maximum among flow flowing through links in the PPA, the CPPA could
tackle more complex real-world problems in the future.
- Abstract(参考訳): PPA(Physarum polycephalum inspired algorithm)は、Physarum Solverとしても知られるアルゴリズムである。
実世界の問題をネットワークフローのあるグラフにモデル化し、グラフ内のノード間の距離を計算するための適切な方程式を適用することにより、PPAはシステムの最適化問題やユーザ均衡問題の解法に利用できる。
しかし、最大フロー問題(MF)、最小コスト最大フロー問題(MCMF)、リンク容量化トラフィック割り当て問題(CTAP)などの問題では、キャパシティ制約に従うためにリンクを流れるフローが必要である。
PPAをベースとした新しい枠組みであるCPPA(Capacitated physarum polycephalum inspired algorithm)の欠如により、PPA内のリンクフローに対するキャパシティ制約が許容される。
CPPAの有効性を証明するために,CPPA の MF 問題に対する CPPA (CPPA-MF) と MCFC 問題に対する CPPA (CPPA-CTAP) の3つの応用法を開発した。
実験では、CPPAのすべての応用がこの問題をうまく解決した。
それらのいくつかは、ベースラインアルゴリズムと比較して効率性を示している。
実験の結果,CPPAフレームワークを用いたリンクフロー制御の有効性が確認された。
CPPAは3つの異なるシナリオでうまく適用できるので、非常に堅牢で実装が容易です。
提案手法は,PPA内のリンクを流れる流れの最大値を制御できることで,CPPAは将来的により複雑な現実問題に対処できることを示す。
関連論文リスト
- Learning Solution-Aware Transformers for Efficiently Solving Quadratic Assignment Problem [27.33966993065248]
本研究は,2次割当て問題(QAP)を効率的に解くための学習ベースソリューションに焦点を当てる。
QAPに関する現在の研究は、限られた規模と非効率性に悩まされている。
そこで本研究では,QAPの学習と改善のカテゴリにおける第1の解法を提案する。
論文 参考訳(メタデータ) (2024-06-14T10:15:03Z) - Data-Driven Stochastic AC-OPF using Gaussian Processes [0.0]
この論文は、交流電流(AC)制約(CC)パワーフロー(OPF)問題を解決するために、機械学習に基づくデータ駆動アルゴリズムの開発に焦点を当てている。
論文 参考訳(メタデータ) (2024-02-17T19:30:33Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Secrets of RLHF in Large Language Models Part I: PPO [81.01936993929127]
大規模言語モデル (LLMs) は、人工知能の進歩のためのブループリントを定式化した。
人間のフィードバックによる強化学習(RLHF)がこの追求を支える重要な技術パラダイムとして出現する。
本稿では、RLHFの枠組みを解明し、PPOの内部構造を再評価し、PPOアルゴリズムを構成する部分が政策エージェントの訓練にどのように影響するかを考察する。
論文 参考訳(メタデータ) (2023-07-11T01:55:24Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Monte-Carlo Search for an Equilibrium in Dec-POMDPs [11.726372393432195]
分散化された部分的に観測可能なマルコフ決定プロセス(Dec-POMDP)は、協調エージェントのグループに対する個々のコントローラの問題を形式化する。
ナッシュ均衡(各エージェント政策が、他のエージェントにとって最良の反応)を求めることは、よりアクセスしやすくなっている。
提案手法は,Dec-POMDPの生成モデル(シミュレータ)のみが利用可能である場合に適応可能であることを示す。
論文 参考訳(メタデータ) (2023-05-19T16:47:46Z) - Deep Reinforcement Learning for Orienteering Problems Based on
Decomposition [13.332999086010718]
本稿では, Knapsack problem (KP) と travel salesman problem (TSP) の2つに分割して, オリエンテーリング問題 (OP) の解法を提案する。
KPソルバはノードの選択に責任を持ち、TSPソルバは適切なパスを設計し、制約違反を判断するKPソルバを支援する。
実験結果から,提案アルゴリズムはトレーニング,推論,能力一般化の点で従来の手法より優れていることが示された。
論文 参考訳(メタデータ) (2022-04-25T11:45:31Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Q-Match: Iterative Shape Matching via Quantum Annealing [64.74942589569596]
形状対応を見つけることは、NP-hard quadratic assignment problem (QAP)として定式化できる。
本稿では,アルファ拡大アルゴリズムに触発されたQAPの反復量子法Q-Matchを提案する。
Q-Match は、実世界の問題にスケールできるような長文対応のサブセットにおいて、反復的に形状マッチング問題に適用できる。
論文 参考訳(メタデータ) (2021-05-06T17:59:38Z) - Queueing Network Controls via Deep Reinforcement Learning [0.0]
待ち行列ネットワークのためのポリシ最適化アルゴリズムを開発した。
このアルゴリズムは、文学における最先端よりも優れた制御ポリシーを一貫して生成する。
PPOアルゴリズムの成功の鍵は、相対値関数を推定するために3つの分散還元技術を使用することである。
論文 参考訳(メタデータ) (2020-07-31T01:02:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。