Fugu-MT 論文翻訳(概要): ARM MTE Performance in Practice (Extended Version)

論文の概要: ARM MTE Performance in Practice (Extended Version)

arxiv url: http://arxiv.org/abs/2601.11786v1
Date: Fri, 16 Jan 2026 21:19:19 GMT
ステータス: 翻訳完了
システム内更新日: 2026-01-28 13:19:49.695273
Title: ARM MTE Performance in Practice (Extended Version)
Title（参考訳）: ARM MTEの実践(拡張版)
Authors: Taehyun Noh, Yingchen Wang, Tal Garfinkel, Mahesh Madhav, Daniel Moghimi, Mattan Erez, Shravan Narayan,
Abstract要約: 4つのマイクロアーキテクチャ上でのARM MTEハードウェア性能の総合解析 AppleのM5チップ上でのMTEの予備解析
参考スコア（独自算出の注目度）: 7.4590304099423195
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present the first comprehensive analysis of ARM MTE hardware performance on four different microarchitectures: ARM Big (A7x), Little (A5x), and Performance (Cortex-X) cores on the Google Pixel 8 and Pixel 9, and on Ampere Computing's AmpereOne CPU core. We also include preliminary analysis of MTE on Apple's M5 chip. We investigate performance in MTE's primary application -- probabilistic memory safety -- on both SPEC CPU benchmarks and in server workloads such as RocksDB, Nginx, PostgreSQL, and Memcached. While MTE often exhibits modest overheads, we also see performance slowdowns up to 6.64x on certain benchmarks. We identify the microarchitectural cause of these overheads and where they can be addressed in future processors. We then analyze MTE's performance for more specialized security applications such as memory tracing, time-of-check time-of-use prevention, sandboxing, and CFI. In some of these cases, MTE offers significant advantages today, while the benefits for other cases are negligible or will depend on future hardware. Finally, we explore where prior work characterizing MTE performance has either been incomplete or incorrect due to methodological or experimental errors.
Abstract（参考訳）: Google Pixel 8とPixel 9のARM Big (A7x), Little (A5x), Performance (Cortex-X)コア,およびAmpere ComputingのAmpereOne CPUコアである。また、AppleのM5チップ上でのMTEの予備分析も含んでいます。我々は、SPEC CPUベンチマークとRocksDB、Nginx、PostgreSQL、Memcachedなどのサーバワークロードの両方で、MTEの主要なアプリケーション --確率的メモリ安全性 -- のパフォーマンスを調査します。 MTEはしばしばわずかなオーバーヘッドを示すが、特定のベンチマークではパフォーマンスの低下が6.64倍になる。これらのオーバヘッドの微構造的原因と、将来のプロセッサでそれらに対処できる場所を同定する。次に、メモリトレース、タイム・オブ・チェックの防止、サンドボックス、CFIといった、より特殊なセキュリティアプリケーションに対して、MTEのパフォーマンスを分析します。これらのケースのいくつかでは、MTEは今日、大きな利点を提供しているが、他のケースの利点は無視できるか、将来のハードウェアに依存するだろう。最後に,MTE性能を特徴付ける先行作業が,方法論的あるいは実験的誤りにより不完全か不完全であるかを考察する。

関連論文リスト

Optimized Memory Tagging on AmpereOne Processors [0.0]
ARM AArch64命令セットアーキテクチャへのメモリタグ拡張(MTE)は、メモリセーフなエスケープに対処するための貴重なツールである。本稿では,アプリケーションメモリ管理を最優先のオーバーヘッド源として,ハードウェア・ソフトウェアスタック全体を解析する。
論文参考訳（メタデータ） (2025-11-21T20:39:31Z)
NanoTag: Systems Support for Efficient Byte-Granular Overflow Detection on ARM MTE [8.471385158176554]
バッファオーバーフローやUse-after-freeといったメモリ安全性のバグは、本番環境でのソフトウェア安全性の問題の主要な原因である。 ArmのMemory Tagging Extension (MTE)は、ハードウェアのこれらのバグをはるかに少ないオーバーヘッドで検出する、有望な代替手段を提供する。 ARM MTEを用いて,修正されていないバイナリのメモリ安全性のバグをバイト単位で検出するシステムであるNanoTagを提案する。
論文参考訳（メタデータ） (2025-09-26T08:03:22Z)
Challenging GPU Dominance: When CPUs Outperform for On-Device LLM Inference [6.829272097221596]
我々は、CPUのみの構成で毎秒17トークンを実現し、GPUアクセラレーションによって得られた毎秒12.8トークンを超えることを示す。この逆直感的な結果の要因を分析し,GPUメモリ転送オーバーヘッドとCPUスレッド最適化が重要な役割を担っていることを明らかにした。我々の研究結果は、最適化されたCPU推論の未解決の可能性を浮き彫りにして、従来のGPU優先の思考に挑戦する。
論文参考訳（メタデータ） (2025-05-09T23:05:53Z)
MOM: Memory-Efficient Offloaded Mini-Sequence Inference for Long Context Language Models [72.61076288351201]
メモリ効率の良いオフロードミニシーケンス推論(MOM)を提案する。 MOMは重要なレイヤを小さな“ミニシーケンス”に分割し、KVキャッシュのオフロードとシームレスに統合する。 Meta-Llama-3.2-8Bでは、単一のA100 80GB GPU上での最大コンテキスト長を155kから455kに拡張する。
論文参考訳（メタデータ） (2025-04-16T23:15:09Z)
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator [65.62084602011596]
大規模言語モデル(LLM)は、自然言語処理タスクの範囲で例外的な性能を示した。特定の意味のないセパレータトークン(句読点)は意味的に意味のあるトークンと比較して注意点に不均等に寄与する。 SepLLMは,これらのセグメントを圧縮し,冗長なトークンを除去することによって推論を高速化する,プラグアンドプレイフレームワークである。
論文参考訳（メタデータ） (2024-12-16T18:58:57Z)
vTensor: Flexible Virtual Tensor Management for Efficient LLM Serving [53.972175896814505]
大規模言語モデル(LLM)は様々なドメインで広く使われ、数百万の日次要求を処理する。大規模言語モデル(LLM)は様々なドメインで広く使われ、数百万の日次要求を処理する。
論文参考訳（メタデータ） (2024-07-22T14:37:58Z)
TikTag: Breaking ARM's Memory Tagging Extension with Speculative Execution [17.188439165717053]
ARM Memory Tagging Extension (MTE)は、ARMv8.5-Aアーキテクチャで導入された新しいハードウェア機能で、メモリ破損の脆弱性を検出することを目的としている。本稿では,MTEに対する投機的実行攻撃による潜在的なセキュリティリスクについて検討する。我々はTikTagガジェットが4秒未満で95%以上の成功率でMTEタグをリークできることを示す。
論文参考訳（メタデータ） (2024-06-13T00:48:51Z)
MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。 MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文参考訳（メタデータ） (2022-04-27T14:00:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。