論文の概要: Learning to Decipher from Pixels -- A Case Study of Copiale
- arxiv url: http://arxiv.org/abs/2604.23683v1
- Date: Sun, 26 Apr 2026 12:51:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.498332
- Title: Learning to Decipher from Pixels -- A Case Study of Copiale
- Title(参考訳): ピクセルの解読を学習する -コピールを事例として-
- Authors: Lei Kang, Giuseppe De Gregorio, Raphaela Heil, Alicia Fornés, Beáta Megyesi,
- Abstract要約: 本稿では,手書きの暗号画像を直接平文にマッピングするエンドツーエンドの書き起こし不要な手法を提案する。
汎用的な手書きデータに対する事前学習と、暗号固有の微調整により、解読精度が大幅に向上することを示す。
以上の結果から, 転写のない画像からテキストへの復号化は, 歴史的置換暗号にも有効であることが示唆された。
- 参考スコア(独自算出の注目度): 4.238413656800081
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Historical encrypted manuscripts require both paleographic interpretation of cipher symbols and cryptanalytic recovery of plaintext. Most existing computational workflows rely on a transcription-first paradigm, in which handwritten symbols are transcribed prior to decipherment. This intermediate step is labor-intensive, error-prone, and not always aligned with the goal of direct plaintext recovery. We propose an end-to-end, transcription-free approach that directly maps handwritten cipher images to plaintext. Using the Copiale cipher as a case study, we introduce the first text-line-level dataset pairing cipher images with German plaintext. We show that pretraining on generic handwriting data followed by cipher-specific fine-tuning substantially improves decipherment accuracy. Our results demonstrate that transcription-free image-to-plaintext decipherment is both feasible and effective for historical substitution ciphers, offering a simplified and scalable alternative to traditional pipelines. https://github.com/leitro/Decipher-from-Pixels-Copiale
- Abstract(参考訳): 歴史的暗号化された写本は、暗号記号の古的解釈と平文の解読的復元の両方を必要とする。
既存の計算ワークフローの多くは、解読の前に手書き記号が書き起こされる書き起こし優先パラダイムに依存している。
この中間ステップは、労働集約的でエラーを起こし、直接平文回復の目標と常に一致しているわけではない。
本稿では,手書きの暗号画像を直接平文にマッピングするエンドツーエンドの書き起こし不要な手法を提案する。
ケーススタディとしてCopiale暗号を用いて,ドイツ語のプレーンテキストを用いた最初のテキストラインレベルのデータセットペアリング暗号画像を提案する。
汎用的な手書きデータに対する事前学習と、暗号固有の微調整により、解読精度が大幅に向上することを示す。
本研究は, 従来のパイプラインに代えて, 書き起こしのない画像からテキストへの復号化が, 歴史的置換暗号に有効であり, 簡易かつスケーラブルな代替手段であることを示すものである。
https://github.com/leitro/Decipher-from-Pixels-Copiale
関連論文リスト
- ALICE: An Interpretable Neural Architecture for Generalization in Substitution Ciphers [0.3403377445166164]
本稿では、ニューラルネットワークの推論と一般化を研究するための理想的なテストベッドとして、暗号解法を提案する。
我々は,この復号化問題の精度と速度を両立させる,シンプルなエンコーダのみの変換器であるALICEを開発した。
驚くべきことに、ALICEはsim1500$のユニークな暗号をトレーニングした後、目に見えない暗号に一般化している。
論文 参考訳(メタデータ) (2025-09-08T23:33:53Z) - Secure Semantic Communication With Homomorphic Encryption [52.5344514499035]
本稿では,SemCom に準同型暗号を適用する可能性について検討する。
タスク指向のSemComスキームを提案する。
論文 参考訳(メタデータ) (2025-01-17T13:26:14Z) - Decoder Pre-Training with only Text for Scene Text Recognition [54.93037783663204]
シーンテキスト認識(STR)事前学習法は,主に合成データセットに依存し,顕著な進歩を遂げている。
STR(DPTR)用テキストのみを用いたDecoder Pre-trainingという新しい手法を提案する。
DPTRはCLIPテキストエンコーダが生成したテキスト埋め込みを擬似視覚埋め込みとして扱い、デコーダの事前訓練に使用する。
論文 参考訳(メタデータ) (2024-08-11T06:36:42Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - CipherSniffer: Classifying Cipher Types [0.0]
我々は復号化タスクを分類問題とする。
まず、転置、置換、テキストの反転、単語の反転、文のシフト、暗号化されていないテキストのデータセットを作成します。
論文 参考訳(メタデータ) (2023-06-13T20:18:24Z) - Segmenting Numerical Substitution Ciphers [27.05304607253758]
歴史的置換暗号の解読は難しい問題である。
Byte Pair を用いてそれらの暗号を分割する最初の自動手法を提案する。
また、格子と事前学習言語モデルを用いて、既存のキーで非決定論的暗号を解く方法を提案する。
論文 参考訳(メタデータ) (2022-05-25T06:45:59Z) - Text Compression-aided Transformer Encoding [77.16960983003271]
本稿では,トランスフォーマーのエンコーディングを強化するために,明示的で暗黙的なテキスト圧縮手法を提案する。
バックボーン情報、つまり入力テキストのgistは、特に焦点を当てていません。
評価の結果,提案した明示的かつ暗黙的なテキスト圧縮手法は,強いベースラインと比較して結果を改善することがわかった。
論文 参考訳(メタデータ) (2021-02-11T11:28:39Z) - Cross-Thought for Sentence Encoder Pre-training [89.32270059777025]
Cross-Thoughtは、事前トレーニングシーケンスエンコーダに対する新しいアプローチである。
我々は、Transformerベースのシーケンスエンコーダを、多数の短いシーケンスに対してトレーニングする。
質問応答とテキストのエンコーダタスクの実験は、事前学習したエンコーダが最先端のエンコーダより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-07T21:02:41Z) - A Few-shot Learning Approach for Historical Ciphered Manuscript
Recognition [3.0682439731292592]
少数ショットオブジェクト検出に基づく手書き音声認識のための新しい手法を提案する。
合成データのトレーニングにより,提案アーキテクチャは未知のアルファベットで手書きの暗号を認識可能であることを示す。
論文 参考訳(メタデータ) (2020-09-26T11:49:18Z) - Adversarial Watermarking Transformer: Towards Tracing Text Provenance
with Data Hiding [80.3811072650087]
自然言語の透かしを防御として研究し,テキストの出所の発見と追跡に役立てる。
本稿では,適応型透かし変換器(AWT)とエンコーダ・デコーダ・デコーダを併用した対向型透かし変換器(AWT)について述べる。
AWTは、テキストにデータを隠蔽する最初のエンドツーエンドモデルである。
論文 参考訳(メタデータ) (2020-09-07T11:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。