Fugu-MT 論文翻訳(概要): Play It Cool: Dynamic Shifting Prevents Thermal Throttling

論文の概要: Play It Cool: Dynamic Shifting Prevents Thermal Throttling

arxiv url: http://arxiv.org/abs/2206.10849v1
Date: Wed, 22 Jun 2022 05:21:34 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-23 14:48:43.819982
Title: Play It Cool: Dynamic Shifting Prevents Thermal Throttling
Title（参考訳）: play it cool: 動的シフトは熱スロットリングを防ぐ
Authors: Yang Zhou, Feng Liang, Ting-wu Chin, Diana Marculescu
Abstract要約: 本稿では,携帯電話におけるサーマルスロットリングの影響について検討する。本稿では、共有重み付き動的ネットワークと、大小MLモデルの動的シフトを利用することを提案する。提案された動的シフトにより、アプリケーションはCPUクロック周波数の劣化や遅延の増加を経験することなく、一貫して動作する。
参考スコア（独自算出の注目度）: 24.1818447900859
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Machine learning (ML) has entered the mobile era where an enormous number of ML models are deployed on edge devices. However, running common ML models on edge devices continuously may generate excessive heat from the computation, forcing the device to "slow down" to prevent overheating, a phenomenon called thermal throttling. This paper studies the impact of thermal throttling on mobile phones: when it occurs, the CPU clock frequency is reduced, and the model inference latency may increase dramatically. This unpleasant inconsistent behavior has a substantial negative effect on user experience, but it has been overlooked for a long time. To counter thermal throttling, we propose to utilize dynamic networks with shared weights and dynamically shift between large and small ML models seamlessly according to their thermal profile, i.e., shifting to a small model when the system is about to throttle. With the proposed dynamic shifting, the application runs consistently without experiencing CPU clock frequency degradation and latency increase. In addition, we also study the resulting accuracy when dynamic shifting is deployed and show that our approach provides a reasonable trade-off between model latency and model accuracy.
Abstract（参考訳）: 機械学習(ML)は、エッジデバイスに膨大な数のMLモデルをデプロイするモバイル時代に入った。しかし、エッジデバイス上で共通のMLモデルを継続的に実行することで、計算から過剰な熱を発生させ、過熱を防ぐためにデバイスを「スローダウン」させてしまうことがある。本稿では,携帯電話における熱スロットリングの影響について検討する。発生時,cpuクロック周波数が減少し,モデル推論遅延が劇的に増加する可能性がある。この不快な一貫性のない動作はユーザエクスペリエンスに大きな悪影響を与えますが、長い間見過ごされています。熱絞り対策として, 共有重み付き動的ネットワークの活用, 大型モデルと小型MLモデル間のシームレスなシフト, すなわち, システムが減速しようとしているときに, 小型モデルに移行することを提案する。提案された動的シフトにより、アプリケーションはCPUクロック周波数の劣化や遅延の増加を経験することなく、一貫して動作する。さらに,動的シフトが展開された際の結果の精度についても検討し,モデル遅延とモデル精度との間に合理的なトレードオフをもたらすことを示す。

関連論文リスト

Real-Time Motion-Controllable Autoregressive Video Diffusion [79.32730467857535]
本稿では,AR-Dragを提案する。このAR-Dragは,多様なモーション制御を備えたリアルタイム画像・ビデオ生成のための,RLで拡張された最初の数ステップのARビデオ拡散モデルである。まず,基本動作制御をサポートするためのベースI2Vモデルを微調整し,さらに軌道ベース報酬モデルによる強化により改良する。本設計では、自己学習機構を通じてマルコフ特性を保存し、ステップを選択的に分解することで訓練を加速する。
論文参考訳（メタデータ） (2025-10-09T12:17:11Z)
DyMoDreamer: World Modeling with Dynamic Modulation [52.27044216359359]
深層強化学習(DRL)における重要なボトルネックはサンプル非効率である。動的変調機構を組み込んだ新しいアルゴリズムDyMoDreamerを導入し,動的特徴抽出の改善と時間情報の充実を図る。実験によると、DyMoDreamer は Atari 100$k ベンチマークに新しい最先端のスコアをセットし、平均156.6$% の人間正規化スコアを設定できる。
論文参考訳（メタデータ） (2025-09-29T13:54:42Z)
Temperature-Aware Recurrent Neural Operator for Temperature-Dependent Anisotropic Plasticity in HCP Materials [1.2374932078540024]
本稿では,時間分解能に依存しないニューラルネットワークであるTRNOについて紹介する。 TRNOは高い予測精度を達成し、様々な負荷ケース、温度、時間分解能を効果的に一般化する。また、従来のGRUモデルやLSTMモデルよりも、トレーニング効率と予測性能が優れている。
論文参考訳（メタデータ） (2025-08-26T08:40:42Z)
CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文参考訳（メタデータ） (2025-08-15T07:49:22Z)
Hybrid Neural-MPM for Interactive Fluid Simulations in Real-Time [57.30651532625017]
本稿では,数値シミュレーション,神経物理,生成制御を統合した新しいハイブリッド手法を提案する。本システムでは, 多様な2D/3Dシナリオ, 材料タイプ, 障害物相互作用における堅牢な性能を示す。受け入れ次第、モデルとデータの両方をリリースすることを約束します。
論文参考訳（メタデータ） (2025-05-25T01:27:18Z)
Thermalizer: Stable autoregressive neural emulation of spatiotemporal chaos [32.51861730498945]
本研究では, 自己回帰エミュレータのロールアウトを安定化するために, 無変量尺度のスコアを暗黙的に推定できることを示す。本研究では,このモデルを用いて自動回帰ロールアウトの安定化を図ることができることを示す。
論文参考訳（メタデータ） (2025-03-24T14:38:33Z)
MotionStreamer: Streaming Motion Generation via Diffusion-based Autoregressive Model in Causal Latent Space [40.60429652169086]
テキスト条件付きストリーミングモーション生成では、可変長の歴史的動きと入ってくるテキストに基づいて、次のステップの人間のポーズを予測する必要がある。既存の方法は、例えば拡散モデルが予め定義された動き長によって制約されるような、ストリーミングモーション生成を達成するのに苦労している。本研究では,連続因果遅延空間を確率論的自己回帰モデルに組み込む新しいフレームワークであるMotionStreamerを提案する。
論文参考訳（メタデータ） (2025-03-19T17:32:24Z)
FuXi-$α$: Scaling Recommendation Model with Feature Interaction Enhanced Transformer [81.12174905444229]
近年の進歩は、大規模レコメンデーションモデルに逐次レコメンデーションモデルを拡張することが効果的な戦略であることを示している。これらの問題に対処するために、FuXi-$alpha$と呼ばれる新しいモデルを提案する。我々のモデルは既存のモデルよりも優れており、モデルのサイズが大きくなるにつれてその性能は継続的に向上する。
論文参考訳（メタデータ） (2025-02-05T09:46:54Z)
Lotus: learning-based online thermal and latency variation management for two-stage detectors on edge devices [35.05167987125874]
2段階の物体検出器は、特に小さな物体を識別するために、高精度で正確な位置測定を行う。 2段階検出法に関連する計算コストは、エッジデバイスでより深刻な熱問題を引き起こす。そこで我々は,CPUとGPUの周波数を動的にスケールアップする2段階検出器に適した新しいフレームワークであるLotusを提案する。
論文参考訳（メタデータ） (2024-10-01T18:00:09Z)
Rotated Runtime Smooth: Training-Free Activation Smoother for accurate INT4 inference [54.2589824716527]
大規模言語モデルは、その大規模なため、相当な計算とメモリ移動コストを発生させる。既存のアプローチでは、外れ値と通常の値を2つの行列に分けたり、アクティベーションからウェイトに移行したりしています。 Smooth と Rotation 操作からなる量子化のためのプラグ・アンド・プレイ・アクティベーション・スムーザである Rotated Smooth (RRS) を提案する。提案手法は,LLaMAおよびQwenファミリーにおける最先端の手法より優れており,IF4推論におけるWikiText-2の難易度は57.33から6.66に向上している。
論文参考訳（メタデータ） (2024-09-30T14:59:22Z)
Physics-Informed Machine Learning Towards A Real-Time Spacecraft Thermal Simulator [15.313871831214902]
ここで提示されるPIMLモデルまたはハイブリッドモデルは、軌道上の熱負荷条件によって与えられるノイズの低減を予測するニューラルネットワークで構成されている。我々は,ハイブリッドモデルの計算性能と精度を,データ駆動型ニューラルネットモデルと,地球周回小型宇宙船の高忠実度有限差分モデルと比較した。 PIMLベースのアクティブノダライゼーションアプローチは、ニューラルネットワークモデルや粗いメッシュモデルよりもはるかに優れた一般化を提供すると同時に、高忠実度モデルと比較して計算コストを最大1.7倍削減する。
論文参考訳（メタデータ） (2024-07-08T16:38:52Z)
A Mixture of Experts Approach to 3D Human Motion Prediction [1.4974445469089412]
本研究は,Au-Tonomous Vehicle Motion Detectionなどのアプリケーションにとって重要な領域である,人間の動作予測の課題に対処する。私たちの主な目的は、既存のモデルar-tectureを批判的に評価し、その利点と改善の機会を特定することです。これは完全に微分可能なスパーストランスであり、推論コストの低いモデルキャパシティを有効にする有望な能力を示している。
論文参考訳（メタデータ） (2024-05-09T20:26:58Z)
A conditional latent autoregressive recurrent model for generation and forecasting of beam dynamics in particle accelerators [46.348283638884425]
本稿では,加速器内の荷電粒子のダイナミクスを学習するための2段階の非教師付きディープラーニングフレームワークであるLatent Autoregressive Recurrent Model (CLARM)を提案する。 CLARMは、潜在空間表現をキャプチャしてデコードすることで、様々な加速器サンプリングモジュールでプロジェクションを生成することができる。その結果,提案手法の予測能力と生成能力は,様々な評価指標と比較した場合に有望であることが示唆された。
論文参考訳（メタデータ） (2024-03-19T22:05:17Z)
Motion Flow Matching for Human Motion Synthesis and Editing [75.13665467944314]
本研究では,効率的なサンプリングと効率性を備えた人体運動生成のための新しい生成モデルであるemphMotion Flow Matchingを提案する。提案手法は, 従来の拡散モデルにおいて, サンプリングの複雑さを1000ステップから10ステップに減らし, テキスト・ツー・モーション・ジェネレーション・ベンチマークやアクション・ツー・モーション・ジェネレーション・ベンチマークで同等の性能を実現する。
論文参考訳（メタデータ） (2023-12-14T12:57:35Z)
EMDM: Efficient Motion Diffusion Model for Fast and High-Quality Motion Generation [57.539634387672656]
現在の最先端生成拡散モデルでは、優れた結果が得られたが、品質を犠牲にすることなく、高速な生成に苦慮している。高速かつ高品質な人体運動生成のための効率的な運動拡散モデル(EMDM)を提案する。
論文参考訳（メタデータ） (2023-12-04T18:58:38Z)
Real-time Object Detection for Streaming Perception [84.2559631820007]
ストリーミング知覚は,ビデオオンライン知覚の1つの指標として,レイテンシと精度を共同評価するために提案される。ストリーミング知覚のためのシンプルで効果的なフレームワークを構築します。提案手法はArgoverse-HDデータセット上での競合性能を実現し,強力なベースラインに比べてAPを4.9%向上させる。
論文参考訳（メタデータ） (2022-03-23T11:33:27Z)
Quantum dynamics simulations beyond the coherence time on NISQ hardware by variational Trotter compression [0.0]
我々は,今日のIBM量子ハードウェア上でのハイゼンベルクモデルの時間後力学シミュレーションを実演する。本稿では,現在のハードウェア上で必要なコスト関数,時間進化状態と変動状態の重なりを計測する方法を示す。実ハードウェア上でのシミュレーションの実施に加えて,ノイズのない,ノイズの多い古典シミュレーションを用いて,アルゴリズムの性能とスケーリング挙動について検討する。
論文参考訳（メタデータ） (2021-12-23T15:44:47Z)
Multimode cold-damping optomechanics with delayed feedback [0.34376560669160383]
マルチメカニカル共鳴を用いた冷延光力学における時間遅延の役割について検討する。単一のフィードバックループは、多くのメカニカルモードから熱ノイズを同時に除去するのに十分である。本稿では、フィードバックループに追加の時間遅延を導入することで、そのような有害な影響に対処することを提案する。
論文参考訳（メタデータ） (2020-06-15T14:28:45Z)
Learn to cycle: Time-consistent feature discovery for action recognition [83.43682368129072]
時間的変動を一般化することは、ビデオにおける効果的な行動認識の前提条件である。 Squeeze Re Temporal Gates (SRTG) を導入する。 SRTPGブロックを使用する場合,GFLOの数は最小限に抑えられ,一貫した改善が見られた。
論文参考訳（メタデータ） (2020-06-15T09:36:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。