論文の概要: Evaluating and Enhancing Robustness of Deep Recommendation Systems
Against Hardware Errors
- arxiv url: http://arxiv.org/abs/2307.10244v1
- Date: Mon, 17 Jul 2023 05:35:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 16:37:56.960882
- Title: Evaluating and Enhancing Robustness of Deep Recommendation Systems
Against Hardware Errors
- Title(参考訳): ハードウェアエラーに対する深部勧告システムのロバスト性評価と改善
- Authors: Dongning Ma, Xun Jiao, Fred Lin, Mengshi Zhang, Alban Desmaison,
Thomas Sellinger, Daniel Moore, Sriram Sankar
- Abstract要約: 本稿では,ハードウェアエラーに対するDRS(Deep Recommation System)の堅牢性に関する最初の体系的研究について述べる。
我々は、広く使われているPyTorchの上に、ユーザフレンドリーで効率的で柔軟なエラー注入フレームワークであるTerrorchを開発した。
また、アルゴリズムベースの耐障害性(ABFT)、アクティベーションクリッピング、選択ビット保護(SBP)を含む3つのエラー軽減手法についても検討する。
- 参考スコア(独自算出の注目度): 4.574782240227357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep recommendation systems (DRS) heavily depend on specialized HPC hardware
and accelerators to optimize energy, efficiency, and recommendation quality.
Despite the growing number of hardware errors observed in large-scale fleet
systems where DRS are deployed, the robustness of DRS has been largely
overlooked. This paper presents the first systematic study of DRS robustness
against hardware errors. We develop Terrorch, a user-friendly, efficient and
flexible error injection framework on top of the widely-used PyTorch. We
evaluate a wide range of models and datasets and observe that the DRS
robustness against hardware errors is influenced by various factors from model
parameters to input characteristics. We also explore 3 error mitigation methods
including algorithm based fault tolerance (ABFT), activation clipping and
selective bit protection (SBP). We find that applying activation clipping can
recover up to 30% of the degraded AUC-ROC score, making it a promising
mitigation method.
- Abstract(参考訳): ディープレコメンデーションシステム(DRS)は、エネルギー、効率、レコメンデーション品質を最適化するために、特別なHPCハードウェアとアクセラレーターに大きく依存している。
DRSが配備される大規模艦隊システムで観測されるハードウェアエラーの増加にもかかわらず、DSSの堅牢性はほとんど見過ごされている。
本稿では,ハードウェアエラーに対するdrsのロバスト性に関する最初の体系的研究を行う。
我々は、広く使われているPyTorchの上に、ユーザフレンドリーで効率的で柔軟なエラー注入フレームワークであるTerrorchを開発した。
我々は、幅広いモデルとデータセットを評価し、ハードウェアエラーに対するDSSの堅牢性は、モデルパラメータから入力特性まで様々な要因に影響されていることを観察する。
また,アルゴリズムベースの耐障害性 (ABFT) やアクティベーションクリッピング,選択的ビット保護 (SBP) を含む3つのエラー軽減手法についても検討する。
その結果,アクティベーションクリッピングを施すことで,AUC-ROCスコアの最大30%を回復できることがわかった。
関連論文リスト
- RbFT: Robust Fine-tuning for Retrieval-Augmented Generation against Retrieval Defects [12.5122702720856]
本稿では,検索欠陥に対する大規模言語モデルのレジリエンスを高めるために,Robust Fine-Tuning (RbFT)を提案する。
実験の結果,RbFTは多様な検索条件におけるRAGシステムのロバスト性を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2025-01-30T14:15:09Z) - Towards Understanding Retrieval Accuracy and Prompt Quality in RAG Systems [7.457969700747294]
我々は、RAGシステムのメカニズムをよりよく理解するために、初期の探索的研究を行う。
本稿では,検索用文書の種類,検索用リコール,文書選択,プロンプト技術という4つの設計要素に着目した。
本研究は,各因子がシステム正当性と信頼にどのように影響するかを明らかにし,正確で信頼性の高いRAGシステムの開発に有用な知見を提供する。
論文 参考訳(メタデータ) (2024-11-29T04:25:31Z) - A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。
軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。
本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文 参考訳(メタデータ) (2024-06-25T07:45:00Z) - PVF (Parameter Vulnerability Factor): A Scalable Metric for Understanding AI Vulnerability Against SDCs in Model Parameters [7.652441604508354]
脆弱性因子(Vulnerability Factor, PVF)は、AIモデル脆弱性のパラメータ破損に対する定量化を目標とする指標である。
PVFは、フォールトプロテクションとパフォーマンス/効率のトレードオフのバランスをとる上で、AIハードウェアデザイナに重要な洞察を提供することができる。
推論中にPVFを3種類のタスク/モデルに適用するためのユースケースとして、DLRM、ビジョン分類(CNN)、テキスト分類(BERT)を挙げる。
論文 参考訳(メタデータ) (2024-05-02T21:23:34Z) - Incorporating Gradients to Rules: Towards Lightweight, Adaptive Provenance-based Intrusion Detection [11.14938737864796]
多様な環境に自動的に適応できるルールベースのPIDSであるCAPTAINを提案する。
我々は、微分可能なタグ伝搬フレームワークを構築し、勾配降下アルゴリズムを用いてこれらの適応パラメータを最適化する。
その結果,CAPTAINは検出精度の向上,検出遅延の低減,ランタイムオーバーヘッドの低減,検出アラームや知識の解釈性の向上を実現している。
論文 参考訳(メタデータ) (2024-04-23T03:50:57Z) - FaultGuard: A Generative Approach to Resilient Fault Prediction in Smart Electrical Grids [53.2306792009435]
FaultGuardは、障害タイプとゾーン分類のための最初のフレームワークであり、敵攻撃に耐性がある。
本稿では,ロバスト性を高めるために,低複雑性故障予測モデルとオンライン逆行訓練手法を提案する。
本モデルでは,耐故障予測ベンチマークの最先端を最大0.958の精度で上回っている。
論文 参考訳(メタデータ) (2024-03-26T08:51:23Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Deep Metric Learning for Unsupervised Remote Sensing Change Detection [60.89777029184023]
リモートセンシング変化検出(RS-CD)は、マルチテンポラルリモートセンシング画像(MT-RSI)から関連する変化を検出することを目的とする。
既存のRS-CD法の性能は、大規模な注釈付きデータセットのトレーニングによるものである。
本稿では,これらの問題に対処可能なディープメトリック学習に基づく教師なしCD手法を提案する。
論文 参考訳(メタデータ) (2023-03-16T17:52:45Z) - Fault Detection and Diagnosis with Imbalanced and Noisy Data: A Hybrid
Framework for Rotating Machinery [2.580765958706854]
回転機械製造システムの保守コスト低減には, 故障診断が重要な役割を担っている。
従来のフォールト検出および診断(FDD)フレームワークは、現実の状況に対処する際のパフォーマンスが劣っている。
本稿では、上記の3つのコンポーネントを用いて、効果的な信号ベースFDDシステムを実現するハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-09T01:09:59Z) - RGRecSys: A Toolkit for Robustness Evaluation of Recommender Systems [100.54655931138444]
複数の次元を包含するレコメンダシステムに対して,ロバスト性に関するより包括的視点を提案する。
本稿では、RecSys用のロバストネス評価ツールキットRobustness Gymを紹介し、リコメンダシステムモデルのロバストネスを迅速かつ均一に評価できるようにする。
論文 参考訳(メタデータ) (2022-01-12T10:32:53Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。