論文の概要: Play It Cool: Dynamic Shifting Prevents Thermal Throttling
- arxiv url: http://arxiv.org/abs/2206.10849v1
- Date: Wed, 22 Jun 2022 05:21:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 14:48:43.819982
- Title: Play It Cool: Dynamic Shifting Prevents Thermal Throttling
- Title(参考訳): play it cool: 動的シフトは熱スロットリングを防ぐ
- Authors: Yang Zhou, Feng Liang, Ting-wu Chin, Diana Marculescu
- Abstract要約: 本稿では,携帯電話におけるサーマルスロットリングの影響について検討する。
本稿では、共有重み付き動的ネットワークと、大小MLモデルの動的シフトを利用することを提案する。
提案された動的シフトにより、アプリケーションはCPUクロック周波数の劣化や遅延の増加を経験することなく、一貫して動作する。
- 参考スコア(独自算出の注目度): 24.1818447900859
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning (ML) has entered the mobile era where an enormous number of
ML models are deployed on edge devices. However, running common ML models on
edge devices continuously may generate excessive heat from the computation,
forcing the device to "slow down" to prevent overheating, a phenomenon called
thermal throttling. This paper studies the impact of thermal throttling on
mobile phones: when it occurs, the CPU clock frequency is reduced, and the
model inference latency may increase dramatically. This unpleasant inconsistent
behavior has a substantial negative effect on user experience, but it has been
overlooked for a long time. To counter thermal throttling, we propose to
utilize dynamic networks with shared weights and dynamically shift between
large and small ML models seamlessly according to their thermal profile, i.e.,
shifting to a small model when the system is about to throttle. With the
proposed dynamic shifting, the application runs consistently without
experiencing CPU clock frequency degradation and latency increase. In addition,
we also study the resulting accuracy when dynamic shifting is deployed and show
that our approach provides a reasonable trade-off between model latency and
model accuracy.
- Abstract(参考訳): 機械学習(ML)は、エッジデバイスに膨大な数のMLモデルをデプロイするモバイル時代に入った。
しかし、エッジデバイス上で共通のMLモデルを継続的に実行することで、計算から過剰な熱を発生させ、過熱を防ぐためにデバイスを「スローダウン」させてしまうことがある。
本稿では,携帯電話における熱スロットリングの影響について検討する。発生時,cpuクロック周波数が減少し,モデル推論遅延が劇的に増加する可能性がある。
この不快な一貫性のない動作はユーザエクスペリエンスに大きな悪影響を与えますが、長い間見過ごされています。
熱絞り対策として, 共有重み付き動的ネットワークの活用, 大型モデルと小型MLモデル間のシームレスなシフト, すなわち, システムが減速しようとしているときに, 小型モデルに移行することを提案する。
提案された動的シフトにより、アプリケーションはCPUクロック周波数の劣化や遅延の増加を経験することなく、一貫して動作する。
さらに,動的シフトが展開された際の結果の精度についても検討し,モデル遅延とモデル精度との間に合理的なトレードオフをもたらすことを示す。
関連論文リスト
- Motion Flow Matching for Human Motion Synthesis and Editing [75.13665467944314]
本研究では,効率的なサンプリングと効率性を備えた人体運動生成のための新しい生成モデルであるemphMotion Flow Matchingを提案する。
提案手法は, 従来の拡散モデルにおいて, サンプリングの複雑さを1000ステップから10ステップに減らし, テキスト・ツー・モーション・ジェネレーション・ベンチマークやアクション・ツー・モーション・ジェネレーション・ベンチマークで同等の性能を実現する。
論文 参考訳(メタデータ) (2023-12-14T12:57:35Z) - EMDM: Efficient Motion Diffusion Model for Fast, High-Quality Motion
Generation [59.454161186907875]
高速かつ高品質な人体運動生成のための効率的な運動拡散モデル(EMDM)を提案する。
複雑なデータ分布をモデル化することにより、より大きなサンプリングステップサイズと少ないステップが、モーション合成中に達成される。
論文 参考訳(メタデータ) (2023-12-04T18:58:38Z) - Towards More Accurate Diffusion Model Acceleration with A Timestep
Aligner [84.97253871387028]
数千のデノナイジングステップを用いて画像を生成するために定式化された拡散モデルは通常、遅い推論速度に悩まされる。
最小限のコストで特定の区間に対するより正確な積分方向を見つけるのに役立つ時間ステップ整合器を提案する。
実験により,我々のプラグイン設計を効率的に訓練し,様々な最先端加速度法の推論性能を向上できることが示された。
論文 参考訳(メタデータ) (2023-10-14T02:19:07Z) - Lightweight network towards real-time image denoising on mobile devices [26.130379174715742]
深層畳み込みニューラルネットワークは、画像復調タスクにおいて大きな進歩を遂げている。
複雑なアーキテクチャと計算コストにより、モバイルデバイスへのデプロイが妨げられる。
モバイルフレンドリーなデノベーションネットワークであるMFDNetを提案する。
論文 参考訳(メタデータ) (2022-11-09T05:19:26Z) - Your Autoregressive Generative Model Can be Better If You Treat It as an
Energy-Based One [83.5162421521224]
本稿では,自己回帰生成モデルの学習のための独自のE-ARM法を提案する。
E-ARMは、よく設計されたエネルギーベースの学習目標を活用する。
我々は、E-ARMを効率的に訓練でき、露光バイアス問題を緩和できることを示した。
論文 参考訳(メタデータ) (2022-06-26T10:58:41Z) - Real-time Object Detection for Streaming Perception [84.2559631820007]
ストリーミング知覚は,ビデオオンライン知覚の1つの指標として,レイテンシと精度を共同評価するために提案される。
ストリーミング知覚のためのシンプルで効果的なフレームワークを構築します。
提案手法はArgoverse-HDデータセット上での競合性能を実現し,強力なベースラインに比べてAPを4.9%向上させる。
論文 参考訳(メタデータ) (2022-03-23T11:33:27Z) - Predicting Physics in Mesh-reduced Space with Temporal Attention [15.054026802351146]
本稿では,トランス方式の時間的アテンションモデルを用いて,長期的依存関係をキャプチャする手法を提案する。
本手法は, 複雑な流体力学予測タスクにおいて, 競合するGNNベースラインよりも優れる。
我々のアプローチは、高次元複雑な物理課題の解決に注意に基づくシーケンスモデルの利点をもたらす道を開いたと信じている。
論文 参考訳(メタデータ) (2022-01-22T18:32:54Z) - Quantum dynamics simulations beyond the coherence time on NISQ hardware
by variational Trotter compression [0.0]
我々は,今日のIBM量子ハードウェア上でのハイゼンベルクモデルの時間後力学シミュレーションを実演する。
本稿では,現在のハードウェア上で必要なコスト関数,時間進化状態と変動状態の重なりを計測する方法を示す。
実ハードウェア上でのシミュレーションの実施に加えて,ノイズのない,ノイズの多い古典シミュレーションを用いて,アルゴリズムの性能とスケーリング挙動について検討する。
論文 参考訳(メタデータ) (2021-12-23T15:44:47Z) - Accelerating Simulation of Stiff Nonlinear Systems using Continuous-Time
Echo State Networks [1.1545092788508224]
本研究では, 非線形常微分方程式の代用格子を動的に生成するデータ駆動手法を提案する。
加熱システムの物理的に動機付けられたスケーラブルなモデル上で,CTESNを用いたほぼ一定時間の性能を実証的に実証した。
論文 参考訳(メタデータ) (2020-10-07T17:40:06Z) - Multimode cold-damping optomechanics with delayed feedback [0.34376560669160383]
マルチメカニカル共鳴を用いた冷延光力学における時間遅延の役割について検討する。
単一のフィードバックループは、多くのメカニカルモードから熱ノイズを同時に除去するのに十分である。
本稿では、フィードバックループに追加の時間遅延を導入することで、そのような有害な影響に対処することを提案する。
論文 参考訳(メタデータ) (2020-06-15T14:28:45Z) - Learn to cycle: Time-consistent feature discovery for action recognition [83.43682368129072]
時間的変動を一般化することは、ビデオにおける効果的な行動認識の前提条件である。
Squeeze Re Temporal Gates (SRTG) を導入する。
SRTPGブロックを使用する場合,GFLOの数は最小限に抑えられ,一貫した改善が見られた。
論文 参考訳(メタデータ) (2020-06-15T09:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。