論文の概要: A Reinforcement Learning-Based Task Mapping Method to Improve the Reliability of Clustered Manycores
- arxiv url: http://arxiv.org/abs/2412.19340v1
- Date: Thu, 26 Dec 2024 20:08:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:28:34.010950
- Title: A Reinforcement Learning-Based Task Mapping Method to Improve the Reliability of Clustered Manycores
- Title(参考訳): クラスタ化マルチコアの信頼性向上のための強化学習型タスクマッピング手法
- Authors: Fatemeh Hossein-Khani, Omid Akbari,
- Abstract要約: 本稿では,マルチコアシステムの信頼性向上を目的とした強化学習(RL)に基づくタスクマッピング手法を提案する。
この方法は、binパッキング、Task-to-binマッピング、Task-to-coreマッピングを含む3つのステップから構成される。
提案手法の有効性をSPLASH2およびPARSECベンチマークスイートアプリケーションを用いて16,32,64コアシステムで評価した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The increasing scale of manycore systems poses significant challenges in managing reliability while meeting performance demands. Simultaneously, these systems become more susceptible to different aging mechanisms such as negative-bias temperature instability (NBTI), hot carrier injection (HCI), and thermal cycling (TC), as well as the electromigration (EM) phenomenon. In this paper, we propose a reinforcement learning (RL)-based task mapping method to improve the reliability of manycore systems considering the aforementioned aging mechanisms, which consists of three steps including bin packing, task-to-bin mapping, and task-to-core mapping. In the initial step, a density-based spatial application with noise (DBSCAN) clustering method is employed to compose some clusters (bins) based on the cores temperature. Then, the Q-learning algorithm is used for the two latter steps, to map the arrived task on a core such that the minimum thermal variation is occurred among all the bins. Compared to the state-of-the-art works, the proposed method is performed during runtime without requiring any parameter to be calculated offline. The effectiveness of the proposed technique is evaluated on 16, 32, and 64 cores systems using SPLASH2 and PARSEC benchmark suite applications. The results demonstrate up to 27% increase in the mean time to failure (MTTF) compared to the state-of-the-art task mapping techniques.
- Abstract(参考訳): マルチコアシステムの規模が大きくなると、パフォーマンス要求を満たしながら信頼性を管理する上で大きな課題が生じる。
同時に、これらのシステムは、負バイアス温度不安定(NBTI)、熱キャリア注入(HCI)、熱サイクリング(TC)、およびエレクトロマイグレーション(EM)現象など、様々な老化メカニズムに影響を受けやすいものとなる。
本稿では,上述の老化メカニズムを考慮した多コアシステムの信頼性向上を目的とした,強化学習に基づくタスクマッピング手法を提案する。
初期ステップでは、コア温度に基づいていくつかのクラスタ(ビン)を構成するために、ノイズ付き密度ベース空間アプリケーション(DBSCAN)を用いている。
次に、2つの後半ステップにQ学習アルゴリズムを用いて、到着したタスクをコアにマッピングし、すべてのビン間で最小の熱変動が発生するようにする。
最先端の手法と比較して、提案手法はオフラインで計算されるパラメータを必要とせずに実行中に実行される。
提案手法の有効性をSPLASH2およびPARSECベンチマークスイートアプリケーションを用いて16,32,64コアシステムで評価した。
その結果、最先端のタスクマッピング技術と比較して平均失敗時間(MTTF)は最大で27%増加した。
関連論文リスト
- Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies [3.224364956163198]
強化学習(RL)ポリシは、特に現実世界のハードウェアにデプロイする場合、高周波の発振を引き起こす。
深部RLにおける高周波発振を緩和することを目的とした文献からの手法を同定し,分類し,比較する。
最適性能のハイブリッドは,他の手法よりも優れており,ベースラインよりも26.8%スムーズ性の向上が期待できる。
論文 参考訳(メタデータ) (2024-10-22T02:21:30Z) - Quantum Algorithm Exploration using Application-Oriented Performance
Benchmarks [0.0]
Application-Oriented BenchmarksのQED-Cスイートは、量子コンピュータの性能特性を測定する機能を提供する。
我々は,このベンチマーク手法がより複雑なアプリケーションに適用される可能性を広げる上での課題について検討する。
論文 参考訳(メタデータ) (2024-02-14T06:55:50Z) - Robust Analysis of Multi-Task Learning Efficiency: New Benchmarks on Light-Weighed Backbones and Effective Measurement of Multi-Task Learning Challenges by Feature Disentanglement [69.51496713076253]
本稿では,既存のMTL手法の効率性に焦点をあてる。
バックボーンを小さくしたメソッドの大規模な実験と,MetaGraspNetデータセットを新しいテストグラウンドとして実施する。
また,MTLにおける課題の新規かつ効率的な識別子として,特徴分散尺度を提案する。
論文 参考訳(メタデータ) (2024-02-05T22:15:55Z) - Dense Network Expansion for Class Incremental Learning [61.00081795200547]
最先端のアプローチでは、ネットワーク拡張(NE)に基づいた動的アーキテクチャを使用し、タスクごとにタスクエキスパートを追加する。
精度とモデル複雑性のトレードオフを改善するために,新しい NE 手法である高密度ネットワーク拡張 (DNE) を提案する。
従来のSOTA法では、類似またはより小さなモデルスケールで、精度の点で4%のマージンで性能が向上した。
論文 参考訳(メタデータ) (2023-03-22T16:42:26Z) - DRAGON: Decentralized Fault Tolerance in Edge Federations [13.864161788250856]
我々は、新しいメモリ効率のディープラーニングベースモデル、すなわち生成最適化ネットワーク(GON)を提案する。
GONは入力とサンプルを区別するために単一のネットワークを使用し、メモリフットプリントを大幅に削減する。
本稿では,エッジフェデレーションの性能を迅速に予測し,最適化するためにシミュレーションを実行するDRAGONと呼ばれる分散型フォールトトレランス手法を提案する。
論文 参考訳(メタデータ) (2022-08-16T10:40:28Z) - Feasibility Layer Aided Machine Learning Approach for Day-Ahead
Operations [0.5076419064097734]
デイアヘッド演算は、ジェネレータのコミットスケジュールとディスパッチを決定する、複雑で計算集約的な最適化プロセスを含む。
過去の情報における既存のパターンは、セキュリティ制約単位コミットメント(SCUC)のモデル削減に活用できる。
提案手法は,IEEE 24-Busシステム,IEEE-73バスシステム,IEEE 118-Busシステム,500-Busシステム,ポーランド2383-Busシステムなど,いくつかの試験システムで検証されている。
論文 参考訳(メタデータ) (2022-08-13T22:44:42Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Layer Pruning on Demand with Intermediate CTC [50.509073206630994]
我々はコネクショニスト時間分類(CTC)に基づくASRの訓練と刈り取り方法を提案する。
本稿では,Transformer-CTCモデルをオンデマンドで様々な深さでプルーニングできることを示し,GPU上でのリアルタイム係数を0.005から0.002に改善した。
論文 参考訳(メタデータ) (2021-06-17T02:40:18Z) - Energy-Efficient and Federated Meta-Learning via Projected Stochastic
Gradient Ascent [79.58680275615752]
エネルギー効率のよいメタラーニングフレームワークを提案する。
各タスクは別々のエージェントによって所有されていると仮定するため、メタモデルをトレーニングするために限られたタスクが使用される。
論文 参考訳(メタデータ) (2021-05-31T08:15:44Z) - A Hierarchical Deep Actor-Critic Learning Method for Joint Distribution
System State Estimation [1.7205106391379026]
グリッドエッジにおける顧客のリアルタイム監視は、重要なタスクとなっている。
ほぼリアルタイムなソリューションを実現するために,新しい階層型強化学習支援フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-04T22:38:21Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。