論文の概要: Solving Historical Dictionary Codes with a Neural Language Model
- arxiv url: http://arxiv.org/abs/2010.04746v1
- Date: Fri, 9 Oct 2020 18:04:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 05:42:30.280141
- Title: Solving Historical Dictionary Codes with a Neural Language Model
- Title(参考訳): ニューラルネットワークモデルによる歴史的辞書符号の解法
- Authors: Christopher Chu, Raphael Valenti, Kevin Knight
- Abstract要約: 本稿では,デコード格子を構築し,その格子をニューラルネットワークモデルを用いて探索することにより,単語置換符号の難解化を図る。
暗号ワードトークンの75.1%を正しく解読することができる。
- 参考スコア(独自算出の注目度): 10.542247583068322
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We solve difficult word-based substitution codes by constructing a decoding
lattice and searching that lattice with a neural language model. We apply our
method to a set of enciphered letters exchanged between US Army General James
Wilkinson and agents of the Spanish Crown in the late 1700s and early 1800s,
obtained from the US Library of Congress. We are able to decipher 75.1% of the
cipher-word tokens correctly.
- Abstract(参考訳): 復号格子を構築し、その格子をニューラルネットワークモデルで探索することにより、難解な単語ベースの置換符号を解く。
我々は1700年代後半から1800年代初期にかけて、アメリカ陸軍将軍ジェームズ・ウィルキンソンとスペイン王室の代理人の間で交わされた暗号化された手紙に我々の方法を適用した。
暗号ワードトークンの75.1%を正しく解読することができる。
関連論文リスト
- Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
形式言語理論は、特に認識者に関するものである。
代わりに、非公式な意味でのみ類似したプロキシタスクを使用するのが一般的である。
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価することで、このミスマッチを補正する。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - Structured Analysis and Comparison of Alphabets in Historical Handwritten Ciphers [3.423211639513232]
本稿では,暗号文書のペア比較手法であるCSIメトリックを提案する。
我々は、SIFT、事前学習型埋め込み、OCR記述子などの視覚的特徴を利用した教師なしクラスタリングシナリオにおけるそれらの有効性を評価する。
論文 参考訳(メタデータ) (2024-10-29T10:12:16Z) - Homonym Sense Disambiguation in the Georgian Language [49.1574468325115]
本研究は,ジョージア語における単語センス曖昧化(WSD)課題に対する新しいアプローチを提案する。
これは、ジョージアのCommon Crawls corpusをフィルタリングすることによって形成されたデータセットに基づいて、事前訓練されたLarge Language Model(LLM)の教師付き微調整に基づいている。
論文 参考訳(メタデータ) (2024-04-24T21:48:43Z) - Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文 参考訳(メタデータ) (2024-03-26T09:25:57Z) - CipherSniffer: Classifying Cipher Types [0.0]
我々は復号化タスクを分類問題とする。
まず、転置、置換、テキストの反転、単語の反転、文のシフト、暗号化されていないテキストのデータセットを作成します。
論文 参考訳(メタデータ) (2023-06-13T20:18:24Z) - Transformer-based Model for Word Level Language Identification in
Code-mixed Kannada-English Texts [55.41644538483948]
コードミキシングしたカンナダ英語テキストにおける単語レベル言語識別のためのトランスフォーマーベースモデルを提案する。
The proposed model on the CoLI-Kenglish dataset achieves a weighted F1-score of 0.84 and a macro F1-score of 0.61。
論文 参考訳(メタデータ) (2022-11-26T02:39:19Z) - Segmenting Numerical Substitution Ciphers [27.05304607253758]
歴史的置換暗号の解読は難しい問題である。
Byte Pair を用いてそれらの暗号を分割する最初の自動手法を提案する。
また、格子と事前学習言語モデルを用いて、既存のキーで非決定論的暗号を解く方法を提案する。
論文 参考訳(メタデータ) (2022-05-25T06:45:59Z) - Unsupervised Transfer Learning in Multilingual Neural Machine
Translation with Cross-Lingual Word Embeddings [72.69253034282035]
我々は、言語独立多言語文表現を活用し、新しい言語に容易に一般化する。
複数のロマンス言語を含むベースシステムを用いてポルトガル語から盲目的に復号し、ポルトガル語では36.4 BLEU、ロシア語では12.8 BLEUのスコアを得た。
非反復的逆翻訳によるより実用的な適応アプローチを探求し、高品質の翻訳を生産するモデルの能力を活用します。
論文 参考訳(メタデータ) (2021-03-11T14:22:08Z) - Can Sequence-to-Sequence Models Crack Substitution Ciphers? [15.898270650875158]
最先端の解読法は、ビームサーチとニューラルネットワークモデルを用いて、与えられた暗号に対する候補仮説を評価する。
提案手法は明示的な言語識別を伴わずにテキストを解読でき,雑音に対して頑健であることを示す。
論文 参考訳(メタデータ) (2020-12-30T17:16:33Z) - Codeswitched Sentence Creation using Dependency Parsing [0.0]
コードスイッチングは、世界中の多言語話者にまたがる最も一般的な出来事の1つとなっている。
本稿では,英語文法の構文構造を利用して,英語・ヒンディー語・英語・マラティー語・英語・カンナダ語の文法的に意味のあるコード切替版を開発するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-05T10:00:06Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。