論文の概要: Plaintext Structure Vulnerability: Robust Cipher Identification via a Distributional Randomness Fingerprint Feature Extractor
- arxiv url: http://arxiv.org/abs/2511.08296v1
- Date: Wed, 12 Nov 2025 01:51:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.74607
- Title: Plaintext Structure Vulnerability: Robust Cipher Identification via a Distributional Randomness Fingerprint Feature Extractor
- Title(参考訳): 平文構造脆弱性:分布ランダム性指紋特徴エクストラクタによるロバスト暗号識別
- Authors: Xiwen Ren, Min Luo, Cong Peng, Debiao He,
- Abstract要約: 暗号文バイトからエンドツーエンドを学習しない手法を提案する。
具体的には、暗号文のランダム性特徴を計算するための統計テストのセットに基づいている。
実験結果から,本手法は高い判別性能を実現することが示された。
- 参考スコア(独自算出の注目度): 23.713094083283334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern encryption algorithms form the foundation of digital security. However, the widespread use of encryption algorithms results in significant challenges for network defenders in identifying which specific algorithms are being employed. More importantly, we find that when the plaintext distribution of test data departs from the training data, the performance of classifiers often declines significantly. This issue exposes the feature extractor's hidden dependency on plaintext features. To reduce this dependency, we adopt a method that does not learn end-to-end from ciphertext bytes. Specifically, this method is based on a set of statistical tests to compute the randomness feature of the ciphertext, and then uses the frequency distribution pattern of this feature to construct the algorithms' respective fingerprints. The experimental results demonstrate that our method achieves high discriminative performance (e.g., AUC > 0.98) in the Canterbury Corpus dataset, which contains a diverse set of data types. Furthermore, in our cross-domain evaluation, baseline models' performance degrades significantly when tested on data with a reduced proportion of structured plaintext. In sharp contrast, our method demonstrates high robustness: performance degradation is minimal when transferring between different structured domains, and even on the most challenging purely random dataset, it maintains a high level of ranking ability (AUC > 0.90).
- Abstract(参考訳): 現代の暗号化アルゴリズムはデジタルセキュリティの基礎を形成している。
しかし、暗号化アルゴリズムの普及により、特定のアルゴリズムが採用されているかを特定する上で、ネットワークディフェンダーにとって大きな課題となる。
さらに重要なことは、テストデータの平文分布がトレーニングデータから外れた場合、分類器の性能が著しく低下することがよくあることだ。
この問題は、機能抽出器がプレーンテキスト機能に隠れていることを露呈する。
この依存関係を減らすために、暗号文バイトからエンドツーエンドを学習しない手法を採用する。
具体的には、暗号文のランダム性特徴を計算し、その特徴の周波数分布パターンを用いてアルゴリズムの各指紋を構成する。
実験の結果,Canterbury Corpus データセットの識別性能(例えば AUC > 0.98 )は多種多様なデータ型を含む。
さらに、ドメイン間の評価では、ベースラインモデルの性能は、構造化された平文の比率が低いデータ上でテストすると著しく低下する。
一方,本手法では,異なる構成領域間での転送時の性能劣化は最小限であり,最も困難な純粋にランダムなデータセットでも高いランク付け能力(AUC > 0.90)を維持している。
関連論文リスト
- LRANet++: Low-Rank Approximation Network for Accurate and Efficient Text Spotting [118.93173826110815]
高精度検出のための低ランク近似に基づく新しいパラメータ化テキスト形状法を提案する。
異なるテキストの輪郭間の固有形状相関を利用して、形状表現の一貫性とコンパクト性を実現する。
我々は、LRANet++と呼ばれるエンドツーエンドテキストスポッティングフレームワークを構築するために、拡張検出モジュールを軽量な認識ブランチに統合する。
論文 参考訳(メタデータ) (2025-11-08T03:08:03Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - Benchmarking Fraud Detectors on Private Graph Data [70.4654745317714]
現在、多くの種類の不正は、グラフ上で動く自動検出アルゴリズムによって部分的に管理されている。
データ保有者が不正検知器の開発を第三者にアウトソースしようとするシナリオを考察する。
サードパーティは、不正検出をデータ保持者に送信し、これらのアルゴリズムをプライベートデータセットで評価し、その結果を公表する。
本システムに対する現実的なプライバシ攻撃を提案し,評価結果のみに基づいて個人データの匿名化を可能にする。
論文 参考訳(メタデータ) (2025-07-30T03:20:15Z) - Using Modular Arithmetic Optimized Neural Networks To Crack Affine Cryptographic Schemes Efficiently [0.27309692684728615]
ハイブリッドニューラルネットワークアーキテクチャを用いたアフィン暗号の暗号解析について検討する。
提案手法は, 生の暗号文列を処理するモジュール分岐と, 文字の周波数特性を利用する統計分岐を統合する。
論文 参考訳(メタデータ) (2025-07-17T04:54:10Z) - Feature Homomorphism -- A Cryptographic Scheme For Data Verification Under Ciphertext-Only Conditions [0.0]
本稿では、新しいタイプの準同型:特徴準同型を提案する。
この機能に基づいて、暗号文のみの条件下でのデータ検証のための暗号スキームを導入する。
提案手法は,本論文で概説した要件を満たすアルゴリズム群を設計することを含む。
論文 参考訳(メタデータ) (2024-10-22T15:30:24Z) - Contextual Model Aggregation for Fast and Robust Federated Learning in
Edge Computing [88.76112371510999]
フェデレーション学習は、ネットワークエッジにおける分散機械学習の第一候補である。
既存のアルゴリズムは、性能の緩やかな収束や堅牢性の問題に直面している。
そこで本稿では,損失低減に対する最適コンテキスト依存境界を実現するためのコンテキストアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T21:42:31Z) - A Fast Randomized Algorithm for Massive Text Normalization [26.602776972067936]
大規模テキストデータのクリーン化と正準化を行うスケーラブルなランダム化アルゴリズムであるFLANを提案する。
本アルゴリズムは, 単語間のジャカード類似性を利用して補正結果を提案する。
実世界のデータセットに対する実験結果は,FLANの有効性と有効性を示す。
論文 参考訳(メタデータ) (2021-10-06T19:18:17Z) - An Analysis of Robustness of Non-Lipschitz Networks [35.64511156980701]
小さな入力摂動は、しばしばネットワークの最終層の特徴空間において大きな動きを引き起こす。
我々のモデルでは、敵対者は特徴空間において任意の距離でデータを移動することができるが、ランダムな低次元部分空間においてのみである。
データ駆動方式を用いて,アルゴリズムパラメータの設定を精度保持トレードオフよりも最適化するための理論的保証を提供する。
論文 参考訳(メタデータ) (2020-10-13T03:56:39Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。