論文の概要: OnDA: On-device Channel Pruning for Efficient Personalized Keyword Spotting
- arxiv url: http://arxiv.org/abs/2603.02247v1
- Date: Wed, 25 Feb 2026 13:35:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.459598
- Title: OnDA: On-device Channel Pruning for Efficient Personalized Keyword Spotting
- Title(参考訳): OnDA: 効率的なパーソナライズされたキーワードスポッティングのためのオンデバイスチャネルプルーニング
- Authors: Matteo Risso, Alessio Burrello, Daniele Jahier Pagliari,
- Abstract要約: Always-onキーワードスポッティング(KWS)は、ユーザと環境固有の分散シフトに対応するためにデバイス上での適応を要求する。
本稿では,オンラインチャネルプルーニングの形で,はじめて重み適応とアーキテクチャ適応を結合する手法を提案する。
- 参考スコア(独自算出の注目度): 3.0829001748700637
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Always-on keyword spotting (KWS) demands on-device adaptation to cope with user- and environment-specific distribution shifts under tight latency and energy budgets. This paper proposes, for the first time, coupling weight adaptation (i.e., on-device training) with architectural adaptation, in the form of online structured channel pruning, for personalized on-device KWS. Starting from a state-of-the-art self-learning personalized KWS pipeline, we compare data-agnostic and data-aware pruning criteria applied on in-field pseudo-labelled user data. On the HeySnips and HeySnapdragon datasets, we achieve up to 9.63x model-size compression with respect to unpruned baselines at iso-task performance, measured as the accuracy at 0.5 false alarms per hour. When deploying our adaptation pipeline on a Jetson Orin Nano embedded GPU, we achieve up to 1.52x/1.57x and 1.64x/1.77x latency and energy-consumption improvements during online training/inference compared to weights-only adaptation.
- Abstract(参考訳): 常にキーワードスポッティング(KWS)は、厳密なレイテンシとエネルギー予算の下で、ユーザおよび環境固有の分散シフトに対処するためにデバイス上の適応を要求する。
本稿では,オンデバイス・トレーニング(オンデバイス・トレーニング)とアーキテクチャ・アダプティブ(アーキテクチャ・アダプティブ)を,オンライン・構造化チャネル・プルーニング(オンライン・コンストラクト・プルーニング)という形で初めて,オンデバイス・KWSをパーソナライズする手法を提案する。
最先端の自己学習型パーソナライズされたKWSパイプラインから始めて、フィールド内擬似ラベル付きユーザデータに適用されるデータ非依存およびデータ対応プルーニング基準を比較した。
HeySnips と HeySnapdragon のデータセットでは,アイソタスク性能における未解析ベースラインに対して,最大9.63倍のモデルサイズ圧縮を実現し,その精度を1時間あたり0.5偽アラームで測定した。
Jetson Orin Nano組み込みGPUにアダプティブパイプラインをデプロイすると、ウェイトのみの適応と比較して、オンライントレーニング/推論中に最大1.22x/1.57xと1.64x/1.77xのレイテンシとエネルギー消費の改善が達成される。
関連論文リスト
- PlugSI: Plug-and-Play Test-Time Graph Adaptation for Spatial Interpolation [21.615719024977537]
PlugSIは2つの重要な革新を通じてテストタイムグラフを洗練するプラグイン・アンド・プレイフレームワークである。
まず、テスト時に各小バッチの新しいグラフ構造に適応する未知のトポロジ適応器(UTA)を設計する。
第2に,UTA適応を導くため,安定した歴史的コンセンサスを維持したテンポラルバランスアダプタ(TBA)を導入する。
論文 参考訳(メタデータ) (2026-02-10T14:33:23Z) - LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - Lightweight Test-Time Adaptation for EMG-Based Gesture Recognition [2.414036142474149]
本稿では,TCNバックボーンを用いたテスト時間適応(TTA)のための軽量フレームワークを提案する。
本稿では, リアルタイム統計アライメントのための因果適応バッチ正規化, (ii) ガウス混合モデル(GMM)アライメント, (iii) 迅速な数ショットキャリブレーションのためのメタラーニングの3つの展開対応戦略を紹介する。
評価の結果,経験再生更新は限られたデータの下では優れた安定性を示し,メタラーニングは1ショットと2ショットのレギュレーションにおいて競争性能を達成していることがわかった。
論文 参考訳(メタデータ) (2026-01-07T18:48:31Z) - CHORD: Customizing Hybrid-precision On-device Model for Sequential Recommendation with Device-cloud Collaboration [28.97362695603172]
underlinetextbfDevice-cloudコラボレーション(textbfCHORD)を用いたシーケンシャルアンダーラインtextbfRecommendationのための underlinetextbfHybrid-precision underlinetextbfOn-device Model のカスタマイズフレームワークを提案する。
CHORDはバックプロパゲーションなしで動的モデル適応と推論を加速し、コストのかかる再訓練サイクルを排除します。
論文 参考訳(メタデータ) (2025-10-03T14:20:45Z) - Self-Learning for Personalized Keyword Spotting on Ultra-Low-Power Audio Sensors [27.684160259995174]
本稿では,超低消費電力スマートオーディオセンサへの展開後,個人化キーワードスポッティング(KWS)モデルを段階的に学習する自己学習手法を提案する。
類似度スコアに基づいて,新たに録音した音声フレームに擬似ラベルを割り当てることにより,ラベル付きトレーニングデータがないという根本的な問題に対処する。
私たちの経験的結果は、極端に自己適応型のKWSセンサを配置する方法を舗装しています。
論文 参考訳(メタデータ) (2024-08-22T15:17:02Z) - Token Compensator: Altering Inference Cost of Vision Transformer without Re-Tuning [63.43972993473501]
視覚変換器(ViT)の訓練と推論を高速化するトークン圧縮
しかし、下流タスクに適用した場合、圧縮度はトレーニングと推論の段階で不一致となる。
本稿では,2段階間の圧縮度を分離するモデル演算フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-13T10:36:43Z) - Visual Prompt Tuning for Test-time Domain Adaptation [48.16620171809511]
本稿では,2つの重要な要素を持つデータ効率・プロンプト・チューニング(DePT)と呼ばれる簡単なレシピを提案する。
このようなパラメータ効率の良い微調整は,学習対象の雑音に過度に適応することなく,モデル表現を対象領域に効率よく適応させることができる。
パラメータがはるかに少ないため、DePTは主要な適応ベンチマークにおける最先端のパフォーマンスだけでなく、優れたデータ効率を示す。
論文 参考訳(メタデータ) (2022-10-10T16:45:13Z) - Real-time Object Detection for Streaming Perception [84.2559631820007]
ストリーミング知覚は,ビデオオンライン知覚の1つの指標として,レイテンシと精度を共同評価するために提案される。
ストリーミング知覚のためのシンプルで効果的なフレームワークを構築します。
提案手法はArgoverse-HDデータセット上での競合性能を実現し,強力なベースラインに比べてAPを4.9%向上させる。
論文 参考訳(メタデータ) (2022-03-23T11:33:27Z) - Layer Pruning on Demand with Intermediate CTC [50.509073206630994]
我々はコネクショニスト時間分類(CTC)に基づくASRの訓練と刈り取り方法を提案する。
本稿では,Transformer-CTCモデルをオンデマンドで様々な深さでプルーニングできることを示し,GPU上でのリアルタイム係数を0.005から0.002に改善した。
論文 参考訳(メタデータ) (2021-06-17T02:40:18Z) - It's always personal: Using Early Exits for Efficient On-Device CNN
Personalisation [19.046126301352274]
強力なハードウェアとモデル圧縮技術が利用可能になったことにより、デバイス上での機械学習が現実化しつつある。
本研究では、より小さなパーソナライズされたモデルを用いて特定のシナリオに適合させることを観察する。
PershonEPEEは、初期出口をモデルにアタッチし、デバイス上でパーソナライズするフレームワークである。
論文 参考訳(メタデータ) (2021-02-02T09:10:17Z) - A Privacy-Preserving-Oriented DNN Pruning and Mobile Acceleration
Framework [56.57225686288006]
モバイルエッジデバイスの限られたストレージとコンピューティング能力を満たすために、ディープニューラルネットワーク(DNN)の軽量プルーニングが提案されている。
従来のプルーニング手法は主に、ユーザデータのプライバシを考慮せずに、モデルのサイズを減らしたり、パフォーマンスを向上させることに重点を置いていた。
プライベートトレーニングデータセットを必要としないプライバシ保護指向のプルーニングおよびモバイルアクセラレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-13T23:52:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。