論文の概要: Track-Assignment Detailed Routing Using Attention-based Policy Model
With Supervision
- arxiv url: http://arxiv.org/abs/2010.13702v1
- Date: Mon, 26 Oct 2020 16:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 18:04:13.024932
- Title: Track-Assignment Detailed Routing Using Attention-based Policy Model
With Supervision
- Title(参考訳): 注意型政策モデルを用いたトラックアサインの詳細なルーティング
- Authors: Haiguang Liao, Qingyi Dong, Weiyi Qi, Elias Fallon, Levent Burak Kara
- Abstract要約: 本稿では、トラック割り当ての詳細ルーティング問題を解決するための機械学習駆動方式を提案する。
我々のアプローチは、注意に基づく強化学習(RL)ポリシーモデルを採用する。
特に複雑な問題に対して, 教師付きRL法が高品質な解であることを示す。
- 参考スコア(独自算出の注目度): 0.27998963147546135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detailed routing is one of the most critical steps in analog circuit design.
Complete routing has become increasingly more challenging in advanced node
analog circuits, making advances in efficient automatic routers ever more
necessary. In this work, we propose a machine learning driven method for
solving the track-assignment detailed routing problem for advanced node analog
circuits. Our approach adopts an attention-based reinforcement learning (RL)
policy model. Our main insight and advancement over this RL model is the use of
supervision as a way to leverage solutions generated by a conventional genetic
algorithm (GA). For this, our approach minimizes the Kullback-Leibler
divergence loss between the output from the RL policy model and a solution
distribution obtained from the genetic solver. The key advantage of this
approach is that the router can learn a policy in an offline setting with
supervision, while improving the run-time performance nearly 100x over the
genetic solver. Moreover, the quality of the solutions our approach produces
matches well with those generated by GA. We show that especially for complex
problems, our supervised RL method provides good quality solution similar to
conventional attention-based RL without comprising run time performance. The
ability to learn from example designs and train the router to get similar
solutions with orders of magnitude run-time improvement can impact the design
flow dramatically, potentially enabling increased design exploration and
routability-driven placement.
- Abstract(参考訳): 詳細なルーティングはアナログ回路設計における最も重要なステップの1つである。
ノードアナログ回路では、完全ルーティングがますます難しくなり、効率的な自動ルータの進歩がさらに必要になった。
本研究では,先進ノードアナログ回路におけるトラック割り当て詳細ルーティング問題を解決するための機械学習方式を提案する。
我々のアプローチは、注意に基づく強化学習(RL)ポリシーモデルを採用する。
このRLモデルに対する我々の主要な洞察と進歩は、従来の遺伝的アルゴリズム(GA)が生み出すソリューションを活用する手段として、監督の利用である。
そこで本研究では,RLポリシーモデルから得られた出力と遺伝的解法から得られた解分布との間のKulback-Leibler分散損失を最小化する。
このアプローチの鍵となる利点は、ルータがオフラインでポリシーを学習できると同時に、遺伝的解決器の100倍近くの性能を向上させることだ。
さらに、私たちのアプローチが生み出すソリューションの品質は、gaが生成するソリューションとよく一致します。
提案手法は,特に複雑な問題に対して,実行時性能を含まずに従来の注意型rlと類似した品質ソリューションを提供する。
例の設計から学び、ルータを訓練して、実行時の大幅な改善の順序で同様のソリューションを得る能力は、設計フローに劇的に影響し、設計探索とルタビリティ駆動の配置を増大させる可能性がある。
関連論文リスト
- Intelligent Routing Algorithm over SDN: Reusable Reinforcement Learning Approach [1.799933345199395]
本稿では,再利用可能なRLSRルーティングアルゴリズム RLSR-Routing をSDN上で開発する。
我々のアルゴリズムは従来の手法よりもロードバランシングの点で優れた性能を示している。
また、複数のトラフィック要求のパスを見つける際には、再利用不可能なRLアプローチよりも早く収束する。
論文 参考訳(メタデータ) (2024-09-23T17:15:24Z) - Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.083337333478674]
本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。
WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文 参考訳(メタデータ) (2024-07-18T02:46:06Z) - An Efficient Learning-based Solver Comparable to Metaheuristics for the
Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。
まず,方向対応型注意モデル(DaAM)を提案する。
第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文 参考訳(メタデータ) (2024-03-11T02:17:42Z) - Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Fidelity-Guarantee Entanglement Routing in Quantum Networks [64.49733801962198]
絡み合いルーティングは、2つの任意のノード間のリモート絡み合い接続を確立する。
量子ネットワークにおける複数のソース・デスティネーション(SD)ペアの忠実性を保証するために、精製可能な絡み合わせルーティング設計を提案する。
論文 参考訳(メタデータ) (2021-11-15T14:07:22Z) - Ranking Cost: Building An Efficient and Scalable Circuit Routing Planner
with Evolution-Based Optimization [49.207538634692916]
そこで我々は、効率よくトレーニング可能なルータを形成するための新しい回路ルーティングアルゴリズム、Randing Costを提案する。
提案手法では,A*ルータが適切な経路を見つけるのに役立つコストマップと呼ばれる新しい変数群を導入する。
我々のアルゴリズムはエンドツーエンドで訓練されており、人工データや人間の実演は一切使用しない。
論文 参考訳(メタデータ) (2021-10-08T07:22:45Z) - A Heuristically Assisted Deep Reinforcement Learning Approach for
Network Slice Placement [0.7885276250519428]
本稿では,Deep Reinforcement Learning(DRL)に基づくハイブリッド配置ソリューションと,Power of Two Choices原則に基づく専用最適化を提案する。
提案したHuristically-Assisted DRL (HA-DRL) は,他の最先端手法と比較して学習プロセスの高速化と資源利用の促進を可能にする。
論文 参考訳(メタデータ) (2021-05-14T10:04:17Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Attention Routing: track-assignment detailed routing using
attention-based reinforcement learning [0.23453441553817037]
そこで我々は新しいルータであるアテンションルータを提案する。このルータは、強化学習を用いてトラック割り当ての詳細ルーティング問題を解決するための最初の試みである。
注目ルータとそのベースライン遺伝ルータは、異なる商用先進技術アナログ回路の問題を解決するために応用される。
論文 参考訳(メタデータ) (2020-04-20T17:50:13Z) - Towards Cognitive Routing based on Deep Reinforcement Learning [17.637357380527583]
本稿では,Deep Reinforcement Learning(DRL)に基づく認知的ルーティングの定義と実装アプローチを提案する。
DRLに基づく認知ルーティングの研究を容易にするために,DRLに基づくルーティングアルゴリズムの開発とシミュレーションのためのシミュレータRL4Netを導入する。
実例ネットワークトポロジのシミュレーション結果から,DDPGに基づくルーティングアルゴリズムはOSPFやランダムウェイトアルゴリズムよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-03-19T03:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。