論文の概要: Attention-Augmented LSTMs for Automatic Homophonic Ciphertext Decipherment
- arxiv url: http://arxiv.org/abs/2606.05078v1
- Date: Wed, 03 Jun 2026 16:35:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.899899
- Title: Attention-Augmented LSTMs for Automatic Homophonic Ciphertext Decipherment
- Title(参考訳): 自動音声暗号のための注意増強型LSTM
- Authors: Micaella Bruton, Meriem Beloucif, Beáta Megyesi,
- Abstract要約: ホモフォニック置換暗号は、各平文文字をいくつかの可能な暗号符号の1つに置き換える。
本稿では,注意増強長短期記憶(LSTM)モデルが歴史的モチベーション付き共有キー設定でそのようなマッピングを学習できるかどうかを評価する。
- 参考スコア(独自算出の注目度): 3.3039362959298537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Homophonic substitution ciphers replace each plaintext letter with one of several possible ciphertext codes, deliberately weakening letter-frequency patterns and making automated decipherment difficult. This paper evaluates whether an attention-augmented Long Short-Term Memory (LSTM) model can learn such mappings in a historically motivated shared-key setting: all ciphertexts draw from the same known homophonic code pool, while individual keys use different consistent subsets of that pool. Using synthetic ciphertexts generated with ChronoFidelius from historical English and Swedish texts dated 1500--1899, we test performance across ciphertext lengths, centuries, variable-length codes, and simulated transcription errors. Models are trained only on aligned ciphertext--plaintext pairs, without external language models, frequency statistics, or key-search heuristics. Results show near-perfect character-level decryption accuracy across both languages and all periods, including short and noisy ciphertexts. The model also fails predictably on ciphertexts outside the shared pool, indicating that it functions as a practical tool for decipherment and key-space verification when key reuse is suspected.
- Abstract(参考訳): ホモフォニック置換暗号は、各平文文字をいくつかの可能な暗号符号の1つに置き換え、意図的に文字周波数パターンを弱め、自動解読を困難にする。
本論文は,注目増強長短短期記憶(LSTM)モデルが歴史的に動機付けられた共有キー設定でそのようなマッピングを学習できるかどうかを,すべての暗号文が同じホモフォニックコードプールから引き出すのに対して,個々のキーはそのプールの異なる一貫したサブセットを使用する。
1500-1899年の歴史的英語とスウェーデン語のテキストからクロノフィデリウスで生成された合成暗号文を用いて、暗号文の長さ、数世紀、可変長符号、シミュレートされた転写誤りを試験した。
モデルは、外部言語モデル、周波数統計、キー検索ヒューリスティックスなしで、整列した暗号文-平文ペアでのみ訓練される。
その結果、短い暗号文やうるさい暗号文を含む、両言語および全期間にわたって、ほぼ完璧な文字レベルの復号化精度が示された。
このモデルは、共有プール外の暗号文でも予測に失敗し、鍵再利用の疑いがある場合に、解読と鍵空間検証のための実用的なツールとして機能することを示す。
関連論文リスト
- ALICE: An Interpretable Neural Architecture for Generalization in Substitution Ciphers [0.3403377445166164]
本稿では、ニューラルネットワークの推論と一般化を研究するための理想的なテストベッドとして、暗号解法を提案する。
我々は,この復号化問題の精度と速度を両立させる,シンプルなエンコーダのみの変換器であるALICEを開発した。
驚くべきことに、ALICEはsim1500$のユニークな暗号をトレーニングした後、目に見えない暗号に一般化している。
論文 参考訳(メタデータ) (2025-09-08T23:33:53Z) - Can Transformers Break Encryption Schemes via In-Context Learning? [0.0]
In-context Learning (ICL)は、トランスフォーマーベースの言語モデルの強力な能力として登場した。
暗号関数学習分野におけるICLの新たな応用を提案する。
論文 参考訳(メタデータ) (2025-08-13T23:09:32Z) - Decoding at the Speed of Thought: Harnessing Parallel Decoding of Lexical Units for LLMs [57.27982780697922]
大規模言語モデルは、自然言語の理解と生成において例外的な能力を示した。
しかし、それらの生成速度は、その復号過程の本質的にシーケンシャルな性質によって制限される。
本稿では,データ駆動方式で実装された新しいデコーディング手法であるLexical Unit Decodingを紹介する。
論文 参考訳(メタデータ) (2024-05-24T04:35:13Z) - Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文 参考訳(メタデータ) (2024-03-26T09:25:57Z) - GPT-4 Is Too Smart To Be Safe: Stealthy Chat with LLMs via Cipher [85.18213923151717]
実験により、いくつかの安全領域において、GPT-4の安全性アライメントをバイパスするために、ある暗号がほぼ100%の時間で成功することが示された。
本稿では,ロールプレイのみを使用し,自然言語によるいくつかの実演を行い,これを誘発する新しいSelfCipherを提案する。
論文 参考訳(メタデータ) (2023-08-12T04:05:57Z) - Context Perception Parallel Decoder for Scene Text Recognition [52.620841341333524]
シーンテキスト認識手法は高い精度と高速な推論速度を達成するのに苦労している。
本稿では、STRにおけるARデコーディングの実証的研究を行い、ARデコーダが言語文脈をモデル化するだけでなく、視覚的文脈知覚のガイダンスも提供することを明らかにする。
我々は一連のCPPDモデルを構築し、提案したモジュールを既存のSTRデコーダにプラグインする。英語と中国語のベンチマーク実験により、CPPDモデルはARベースモデルよりも約8倍高速に動作し、高い競争精度を達成できることを示した。
論文 参考訳(メタデータ) (2023-07-23T09:04:13Z) - Segmenting Numerical Substitution Ciphers [27.05304607253758]
歴史的置換暗号の解読は難しい問題である。
Byte Pair を用いてそれらの暗号を分割する最初の自動手法を提案する。
また、格子と事前学習言語モデルを用いて、既存のキーで非決定論的暗号を解く方法を提案する。
論文 参考訳(メタデータ) (2022-05-25T06:45:59Z) - Can Sequence-to-Sequence Models Crack Substitution Ciphers? [15.898270650875158]
最先端の解読法は、ビームサーチとニューラルネットワークモデルを用いて、与えられた暗号に対する候補仮説を評価する。
提案手法は明示的な言語識別を伴わずにテキストを解読でき,雑音に対して頑健であることを示す。
論文 参考訳(メタデータ) (2020-12-30T17:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。