論文の概要: Trust-Region Method with Deep Reinforcement Learning in Analog Design
Space Exploration
- arxiv url: http://arxiv.org/abs/2009.13772v4
- Date: Thu, 2 Dec 2021 08:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 05:15:54.811975
- Title: Trust-Region Method with Deep Reinforcement Learning in Analog Design
Space Exploration
- Title(参考訳): アナログデザイン空間探索における深層強化学習を用いた信頼領域法
- Authors: Kai-En Yang, Chia-Yu Tsai, Hung-Hao Shen, Chen-Feng Chiang, Feng-Ming
Tsai, Chung-An Wang, Yiju Ting, Chia-Shun Yeh, and Chin-Tang Lai
- Abstract要約: 本稿では,アナログデザイン空間探索の新しい視点を紹介する。
モデルベースエージェントをモデルフリー学習と対比し,信頼領域戦略を実装する。
実験の結果,探索繰り返しにおける桁違いの改善が示された。
- 参考スコア(独自算出の注目度): 1.2189422792863451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces new perspectives on analog design space search. To
minimize the time-to-market, this endeavor better cast as constraint
satisfaction problem than global optimization defined in prior arts. We
incorporate model-based agents, contrasted with model-free learning, to
implement a trust-region strategy. As such, simple feed-forward networks can be
trained with supervised learning, where the convergence is relatively trivial.
Experiment results demonstrate orders of magnitude improvement on search
iterations. Additionally, the unprecedented consideration of PVT conditions are
accommodated. On circuits with TSMC 5/6nm process, our method achieve
performance surpassing human designers. Furthermore, this framework is in
production in industrial settings.
- Abstract(参考訳): 本稿では,アナログデザイン空間探索の新しい視点を紹介する。
市場投入までの時間を最小限に抑えるため、この取り組みは、先行技術で定義されたグローバル最適化よりも制約満足度問題としてより良いキャスティングを行う。
モデルベースエージェントをモデルフリー学習と対比し,信頼領域戦略を実装する。
このように、単純なフィードフォワードネットワークを教師付き学習で訓練することができる。
実験の結果,探索繰り返しにおける桁違いの改善が示された。
また、PVT条件に対する前例のない配慮も考慮されている。
TSMC 5/6nmプロセスの回路において,本手法は設計者を上回る性能を実現する。
さらに、このフレームワークは産業環境で生産されている。
関連論文リスト
- Training Neural Networks from Scratch with Parallel Low-Rank Adapters [50.171622511923474]
計算ノード間の複数の低ランクヘッドの並列トレーニングを実現するために設計された,新しい双方向最適化アルゴリズムである LoRA-the-Explorer (LTE) を導入する。
我々のアプローチには、様々なビジョンデータセットを用いたビジョントランスフォーマーの広範な実験が含まれており、LTEが標準の事前トレーニングと競合していることが示されている。
論文 参考訳(メタデータ) (2024-02-26T18:55:13Z) - Unsupervised Solution Operator Learning for Mean-Field Games via
Sampling-Invariant Parametrizations [8.542383711837866]
我々はMFGソリューション演算子を学習するための新しいフレームワークを開発する。
我々のモデルはMFGインスタンスを入力として取り出し、1つのフォワードパスで解を出力する。
離散化フリーであり、高次元MFGの学習演算子に適している。
論文 参考訳(メタデータ) (2024-01-27T19:07:49Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Robust Model-Based Optimization for Challenging Fitness Landscapes [101.48246514363383]
タンパク質の設計には、フィットネスのランドスケープの最適化が含まれる。
指導法は, トレーニングセットにおける高適合度サンプルの多彩さに課題を呈する。
デザイン空間における「分離」というこの問題は、既存のモデルベース最適化ツールにおいて重大なボトルネックとなっていることを示す。
本稿では,新しいVAEを検索モデルとして利用して問題を克服する手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:47:32Z) - Personalizing Federated Learning with Over-the-Air Computations [84.8089761800994]
フェデレートされたエッジ学習は、プライバシー保護の方法で無線ネットワークのエッジにインテリジェンスをデプロイする、有望な技術である。
このような設定の下で、複数のクライアントは、エッジサーバの調整の下でグローバルジェネリックモデルを協調的にトレーニングする。
本稿では,アナログオーバー・ザ・エア計算を用いて通信ボトルネックに対処する分散トレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-24T08:41:19Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - FreeREA: Training-Free Evolution-based Architecture Search [17.202375422110553]
FreeREAは、トレーニングなしメトリクスの最適化組み合わせを利用してアーキテクチャをランク付けする、独自のセルベースの進化NASアルゴリズムである。
本実験はNAS-Bench-101とNATS-Benchの共通ベンチマークを用いて,フリーレアがモデル自動設計のための高速で効率的かつ効果的な探索手法であることを実証した。
論文 参考訳(メタデータ) (2022-06-17T11:16:28Z) - RLFlow: Optimising Neural Network Subgraph Transformation with World
Models [0.0]
本稿では,ニューラルネットワークのアーキテクチャを最適化するためのモデルベースエージェントを提案する。
提案手法は, 共通の畳み込みネットワーク上での最先端技術の性能に適合し, トランスフォーマースタイルのアーキテクチャでは最大5%性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-03T11:52:54Z) - Few-shot Quality-Diversity Optimization [50.337225556491774]
品質多様性(QD)の最適化は、強化学習における知覚的最小値とスパース報酬を扱う上で効果的なツールであることが示されている。
本稿では,タスク分布の例から,パラメータ空間の最適化によって得られる経路の情報を利用して,未知の環境でQD手法を初期化する場合,数発の適応が可能であることを示す。
ロボット操作とナビゲーションベンチマークを用いて、疎密な報酬設定と密集した報酬設定の両方で実施された実験は、これらの環境でのQD最適化に必要な世代数を著しく削減することを示している。
論文 参考訳(メタデータ) (2021-09-14T17:12:20Z) - Follow Your Path: a Progressive Method for Knowledge Distillation [23.709919521355936]
本稿では,教師モデルの指導信号を学生のパラメータ空間に投影することで,新しいモデルに依存しないProKTを提案する。
画像とテキストの双方で実験した結果,提案したProKTは既存の知識蒸留法と比較して常に優れた性能を発揮することがわかった。
論文 参考訳(メタデータ) (2021-07-20T07:44:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。