論文の概要: 3-Key-Input: Exploring the Theoretical Minimum Keys for Text Entry
- arxiv url: http://arxiv.org/abs/2606.11642v1
- Date: Wed, 10 Jun 2026 04:06:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.285546
- Title: 3-Key-Input: Exploring the Theoretical Minimum Keys for Text Entry
- Title(参考訳): 3-Key-Input: テキスト入力のための理論的最小鍵の探索
- Authors: Naoki Kimura,
- Abstract要約: 本稿では、2-5個の物理キーと言語モデルに基づく曖昧さを組み合わせたテキスト入力システムについて体系的に評価する。
3キー+GPT-4oは文字誤り率(CER)9.46%と単語誤り率(WER)12.20%を達成し、2キーに対してCERを59%削減する。
- 参考スコア(独自算出の注目度): 2.2223434569494525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How far can we reduce the number of physical keys if we endow an ambiguous keyboard with modern language models? Fewer keys increase hardware design freedom in constrained settings such as assistive devices and mobile form factors. This paper systematically evaluates text entry systems using 2-5 physical keys combined with language-model-based disambiguation. On a 300-sentence English corpus (100 sentences each for Business / Conversational / Technical), we compare key counts (2-5), letter-to-key mappings (layout-based / frequency-based / intentionally worst-case), and decoders (Trie-only, GPT-2 beam search, GPT-4o selection). We find that 3 keys + GPT-4o achieves character error rate (CER) 9.46% and word error rate (WER) 12.20%, reducing CER by 59% relative to 2 keys (CER 23.3%). At 3 keys, the key-stream entropy is 1.54 bits/char; while increasing to 5 keys improves accuracy (CER 5.4%), the marginal gains diminish. Mapping choice has a small impact under standard designs (ΔCER < 0.5 pp), and even an intentionally worst mapping degrades CER by only +0.5 pp, whereas Technical sentences yield roughly twice the error rate of Business. These results suggest that, in our evaluated offline setting under a strong LM prior, 3 keys are a practical minimum for general English.
- Abstract(参考訳): 最新の言語モデルであいまいなキーボードを持てば、物理的なキーの数を減らすことができるだろうか?
補助デバイスやモバイルフォームファクタといった制約のある設定では、ハードウェア設計の自由度が低い。
本稿では、2-5個の物理キーと言語モデルに基づく曖昧さを組み合わせたテキスト入力システムについて体系的に評価する。
300文の英文コーパス(ビジネス/会話/技術の各100文)では、キーカウント(2-5)、レター・ツー・キーマッピング(レイアウトベース/周波数ベース/意図的に最悪のケース)、デコーダ(トリーオン、GPT-2ビームサーチ、GPT-4o選択)を比較します。
3つのキー+GPT-4oは文字誤り率(CER)9.46%と単語誤り率(WER)12.20%を達成し、2つのキー(CER 23.3%)に対してCERを59%削減する。
3つのキーでは、キーストリームエントロピーは1.54ビット/バイトであり、5つのキーに増大すると精度が向上する(CER 5.4%)が、限界ゲインは減少する。
マッピングの選択は標準的な設計(ΔCER < 0.5 pp)では小さな影響しか与えず、意図的に最悪のマッピングでさえCERを0.5 ppしか分解しない。
これらの結果から, 評価済みオフライン設定において, 3つのキーは一般英語では実用最小値であることが示唆された。
関連論文リスト
- Screening Is Enough [0.5076419064097734]
標準ソフトマックスの注意のコアとなる制限は、絶対的なクエリー関連性の概念を定義していないことである。
マルチスクリーン(Multiscreen)は、私たちがスクリーニングと呼ぶメカニズムを中心に構築された言語モデルアーキテクチャである。
すべてのキーに注意を向ける代わりに、スクリーニングは各キーを明示的なしきい値に対して評価し、無関係なキーを破棄し、残りのキーを集約する。
論文 参考訳(メタデータ) (2026-04-01T17:29:08Z) - Key-Conditioned Orthonormal Transform Gating (K-OTG): Multi-Key Access Control with Hidden-State Scrambling for LoRA-Tuned Models [26.81598226089532]
K-OTGはデュアルパスコーパスコーパスでトレーニングする:ロールキーを持つ認証された例はタスクの出力を、未承認例は可視なブロックトークンを学習する。
キーは特別なトークンとして追加されず、LoRAを4ビットベースでクリーンに構成する。
論文 参考訳(メタデータ) (2025-12-19T12:42:53Z) - High Accuracy, Less Talk (HALT): Reliable LLMs through Capability-Aligned Finetuning [84.52940628494879]
大規模言語モデル(LLM)は現在、すべてのプロンプトに応答する。
LLMは、知識や能力の欠如によって、誤った答えを生み出すことができる。
本稿では,その正確性に自信を持った場合にのみコンテンツを生成するためのLCMのポストトレーニングを提案する。
論文 参考訳(メタデータ) (2025-06-04T15:16:21Z) - TRA: Better Length Generalisation with Threshold Relative Attention [58.64717643300818]
トランスフォーマーは長さの一般化に苦慮し、基本的なタスクでも性能が劣っている。
これらの制限が自己認識機構の2つの重要な障害によって説明できるかどうかを検証する。
これらの2つの緩和による注意機構がデコーダのみの変換器の一般化能力を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2025-03-29T18:06:28Z) - Quantize What Counts: More for Keys, Less for Values [63.51476878610841]
大規模言語モデル(LLM)は、キーバリュー(KV)キャッシュに支配される推論時のメモリボトルネックに悩まされる。
本稿ではトランスフォーマーモデルの内在幾何学における混合精度KV量子化を固定する2つの定理を提案する。
論文 参考訳(メタデータ) (2025-02-20T22:24:27Z) - OverHear: Headphone based Multi-sensor Keystroke Inference [1.9915929143641455]
我々は,ヘッドホンの音響および加速度計データを活用するキーストローク推論フレームワークを開発した。
メカニカルキーボードのキー予測精度は,メカニカルキーボードのキー予測精度が約80%,膜キーボードのキー予測精度が約60%である。
その結果,現実シナリオの文脈におけるアプローチの有効性と限界が浮き彫りになった。
論文 参考訳(メタデータ) (2023-11-04T00:48:20Z) - DEFT: A new distance-based feature set for keystroke dynamics [1.8796659304823702]
キーストローク力学では従来考えられていなかった概念であるキーボード上のキー間の距離に基づく新しい特徴セットを提案する。
我々は、DEFT機能と以前に使用したキーストロークダイナミック機能を組み合わせることで、DEFTモデルを構築する。
DEFTモデルはデバイスに依存しないように設計されており、3つの一般的なデバイスで有効性を評価することができる。
論文 参考訳(メタデータ) (2023-10-06T07:26:40Z) - TypeNet: Deep Learning Keystroke Biometrics [77.80092630558305]
TypeNetは、アイデンティティ毎に適度な数のキーストロークでトレーニングされた、リカレントニューラルネットワークである。
5つのギャラリーシーケンスと長さ50のテストシーケンスにより、TypeNetは最先端のキーストロークバイオメトリック認証性能を実現します。
実験では,最大10,000人の被験者による誤りの程度の増加を実証し,インターネット規模でのTypeNetの運用の可能性を示した。
論文 参考訳(メタデータ) (2021-01-14T12:49:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。