論文の概要: DECKER: Domain-invariant Embedding for Cross-Keyboard Extraction and Recognition
- arxiv url: http://arxiv.org/abs/2605.03384v1
- Date: Tue, 05 May 2026 05:43:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.78455
- Title: DECKER: Domain-invariant Embedding for Cross-Keyboard Extraction and Recognition
- Title(参考訳): DECKER: クロスキーボード抽出と認識のためのドメイン不変埋め込み
- Authors: Bikrant Bikram Pratap Maurya, Nitin Choudhury, Daksh Agarwal, Arun Balaji Buduru,
- Abstract要約: キーボード上のアコースティックサイドチャネル攻撃(ASCA)は、重大なセキュリティリスクをもたらす。
HEARは、キーボードの一般化、ノイズ適応、ユーザのバイアスという3つの軸に沿ってASCAを研究するために設計されたデータセットである。
ドメイン不変なキーストローク推論フレームワークであるDECKERを提案する。
- 参考スコア(独自算出の注目度): 7.244731714427563
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Acoustic side-channel attacks (ASCA) on keyboards pose a significant security risk, as keystrokes can be inferred from typing acoustics, revealing sensitive information. Prior ASCA studies are limited by small-scale datasets with restricted diversity in users, keyboards, and environments, constraining analysis across devices, microphones, and noise conditions. We introduce HEAR, a dataset designed to study ASCA along three axes: keyboard generalization, noise adaptation, and user bias. HEAR contains recordings from 53 participants using 37 laptop keyboards, collected in three realistic settings: (1) external microphone capture, (2) device microphone capture without network noise, and (3) VoIP-based streaming capture. This enables controlled evaluation across users, keyboards, and environments. On HEAR, we establish an ASCA benchmark spanning conventional features and pre-trained representations from raw audio and spectrograms in unimodal and multimodal settings. We propose DECKER, a domain-invariant keystroke inference framework with four stages: (1) Keyboard Signature Normalization to reduce device coloration, (2) domain-adversarial disentanglement to suppress keyboard identity, (3) supervised cross-keyboard contrastive alignment to enforce key consistency, and (4) Acoustic Style Randomization to synthesize unseen keyboard responses. We further explore sentence-level inference using an LLM-based post-processing layer to refine keystroke sequences via linguistic context. Results on HEAR show DECKER improves keystroke identification over strong baselines, particularly in cross-keyboard and cross-user settings, with further gains from language-model rectification. These findings highlight that ASCA remains effective across diverse users, devices, and noisy environments, underscoring its practical security risk.
- Abstract(参考訳): キーボード上のアコースティックサイドチャネルアタック(ASCA)は、キーストロークがアコースティックスを入力することによって推測され、センシティブな情報が明らかにされるため、重大なセキュリティリスクをもたらす。
ASCA以前の研究は、ユーザ、キーボード、環境の多様性が制限された小さなデータセットによって制限されており、デバイス、マイク、ノイズ条件間での分析が制限されている。
HEARは、キーボードの一般化、ノイズ適応、ユーザのバイアスの3つの軸に沿ってASCAを研究するために設計されたデータセットである。
HEARには、(1)外部マイクキャプチャ、(2)ネットワークノイズのないデバイスマイクキャプチャ、(3)VoIPベースのストリーミングキャプチャの3つの現実的な設定で収集された、37個のラップトップキーボードを使用した53人の参加者の記録が含まれている。
これにより、ユーザ、キーボード、環境間でのコントロールされた評価が可能になる。
HEAR上では,単調・マルチモーダルな環境下での生音声および分光図からの従来の特徴と事前訓練された表現にまたがるASCAベンチマークを構築した。
DeCKERは,(1)キーボードのシグナチャ正規化によるデバイスカラー化の低減,(2)キーボード識別の抑制のためのドメイン・アドバイサル・アンタングル化,(3)キー整合性を強化するための教師付きクロスキーボードコントラストアライメント,(4)未知のキーボード応答を合成するための音響スタイルランダム化の4段階からなるドメイン不変キーストローク推論フレームワークである。
さらに、LLMベースの後処理層を用いて文レベルの推論を行い、言語コンテキストを用いてキーストロークシーケンスを洗練させる。
HEAR show DECKERは、特にクロスキーボードやクロスユーザ設定において、強力なベースラインよりもキーストローク識別を改善し、言語モデルの修正によってさらに向上する。
これらの結果は、ASCAが多様なユーザ、デバイス、ノイズの多い環境に対して有効であり続けており、その実践的なセキュリティリスクが強調されていることを浮き彫りにしている。
関連論文リスト
- Still Between Us? Evaluating and Improving Voice Assistant Robustness to Third-Party Interruptions [52.45054413627452]
TPI-Trainは、話者認識型ハードネガティブで設計された88Kインスタンスのデータセットで、割り込み処理のための音響キュー優先順位付けを強制する。
TPI-Benchは、割り込み処理戦略を厳格に測定するために設計された総合的な評価フレームワークである。
論文 参考訳(メタデータ) (2026-04-19T10:03:42Z) - DecepGPT: Schema-Driven Deception Detection with Multicultural Datasets and Robust Multimodal Learning [64.33887406863899]
マルチモーダル偽装検出は、法医学とセキュリティのための聴覚的手がかりを解析することにより、偽装行動を特定することを目的としている。
既存のベンチマークでは、中間的な推論手段を使わずにバイナリラベルのみを提供する。
構造的キューレベルの記述と推論チェーンを用いた推論データセットを構築した。
1695年のサンプルでは、非実験的偽装検出データセットとしては最大である。
論文 参考訳(メタデータ) (2026-03-25T04:06:36Z) - An Agent-Based Modeling Approach to Free-Text Keyboard Dynamics for Continuous Authentication [0.0]
フリーテキストキーボードのダイナミクスを活用する継続的認証システムは、多要素認証設定において有望なセキュリティ層を提供する。
本研究では, エージェントベースモデル(ABM)を用いて, メカニカルキーボードおよび膜キーボード間の多様なタイピングプロファイルをシミュレートし, 行動バイオメトリックスの有効性について検討した。
論文 参考訳(メタデータ) (2025-05-08T07:42:05Z) - Acoustic Side Channel Attack on Keyboards Based on Typing Patterns [0.0]
キーボードに対するサイドチャネル攻撃は、入力デバイスとしてキーボードを使用する多くのシステムにおけるセキュリティ対策をバイパスすることができる。
本稿では,現実的な環境におけるユーザのタイピングパターンを考慮に入れた適用方法を提案する。
本手法は実世界のシナリオを考慮した場合, ケーススタディ全体で平均43%の成功率を達成した。
論文 参考訳(メタデータ) (2024-03-13T17:44:15Z) - Keystroke Verification Challenge (KVC): Biometric and Fairness Benchmark
Evaluation [21.63351064421652]
生体認証のためのキーストローク力学(KD)にはいくつかの利点がある。
KDは最も差別的な行動特性の1つである。
KDに基づく生体認証性能と公正性を評価するための新しい実験フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-10T11:23:28Z) - OverHear: Headphone based Multi-sensor Keystroke Inference [1.9915929143641455]
我々は,ヘッドホンの音響および加速度計データを活用するキーストローク推論フレームワークを開発した。
メカニカルキーボードのキー予測精度は,メカニカルキーボードのキー予測精度が約80%,膜キーボードのキー予測精度が約60%である。
その結果,現実シナリオの文脈におけるアプローチの有効性と限界が浮き彫りになった。
論文 参考訳(メタデータ) (2023-11-04T00:48:20Z) - Sign Language Recognition via Skeleton-Aware Multi-Model Ensemble [71.97020373520922]
手話は一般的に、聴覚障害者やミュート人がコミュニケーションするために使われる。
孤立手話認識(SLR)のためのGlobal Ensemble Model(GEM)を用いた新しいマルチモーダルフレームワークを提案する。
提案するSAM-SLR-v2 フレームワークは極めて有効であり,最先端の性能を高いマージンで達成している。
論文 参考訳(メタデータ) (2021-10-12T16:57:18Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z) - SpEx: Multi-Scale Time Domain Speaker Extraction Network [89.00319878262005]
話者抽出は、ターゲット話者の声を複数話者環境から抽出することで、人間の選択的な聴覚的注意を模倣することを目的としている。
周波数領域の抽出を行い、抽出した大きさと推定位相スペクトルから時間領域信号を再構成することが一般的である。
本研究では,混合音声を音声信号を大域・位相スペクトルに分解する代わりに,マルチスケールの埋め込み係数に変換する時間領域話者抽出ネットワーク(SpEx)を提案する。
論文 参考訳(メタデータ) (2020-04-17T16:13:06Z) - End-to-End Automatic Speech Recognition Integrated With CTC-Based Voice
Activity Detection [48.80449801938696]
本稿では,音声活動検出機能とエンドツーエンドの自動音声認識を統合する。
我々は,コネクショニストの時間的分類(CTC)と,同期/アテンションの拡張に焦点を当てた。
簡単なしきい値を用いた音声区間検出のためのキューとしてラベルを用いる。
論文 参考訳(メタデータ) (2020-02-03T03:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。