論文の概要: PassTSL: Modeling Human-Created Passwords through Two-Stage Learning
- arxiv url: http://arxiv.org/abs/2407.14145v1
- Date: Fri, 19 Jul 2024 09:23:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 18:04:03.566754
- Title: PassTSL: Modeling Human-Created Passwords through Two-Stage Learning
- Title(参考訳): PassTSL:2段階学習による人為的パスワードのモデル化
- Authors: Yangde Wang, Haozhang Li, Weidong Qiu, Shujun Li, Peng Tang,
- Abstract要約: NLPと深層学習(DL)で一般的な事前学習ファインタニングフレームワークに着想を得たPassTSL(2段階学習による人為的なパスワードのモデル化)を提案する。
PassTSLはパスワード推測において5つのSOTA(State-of-the-art)パスワードクラッキング法を最大で4.11%から64.69%の差で上回っている。
PassTSLに基づいてパスワード強度計(PSM)も実装し,パスワード強度をより正確に推定できることを示した。
- 参考スコア(独自算出の注目度): 7.287089766975719
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Textual passwords are still the most widely used user authentication mechanism. Due to the close connections between textual passwords and natural languages, advanced technologies in natural language processing (NLP) and machine learning (ML) could be used to model passwords for different purposes such as studying human password-creation behaviors and developing more advanced password cracking methods for informing better defence mechanisms. In this paper, we propose PassTSL (modeling human-created Passwords through Two-Stage Learning), inspired by the popular pretraining-finetuning framework in NLP and deep learning (DL). We report how different pretraining settings affected PassTSL and proved its effectiveness by applying it to six large leaked password databases. Experimental results showed that it outperforms five state-of-the-art (SOTA) password cracking methods on password guessing by a significant margin ranging from 4.11% to 64.69% at the maximum point. Based on PassTSL, we also implemented a password strength meter (PSM), and our experiments showed that it was able to estimate password strength more accurately, causing fewer unsafe errors (overestimating the password strength) than two other SOTA PSMs when they produce the same rate of safe errors (underestimating the password strength): a neural-network based method and zxcvbn. Furthermore, we explored multiple finetuning settings, and our evaluations showed that, even a small amount of additional training data, e.g., only 0.1% of the pretrained data, can lead to over 3% improvement in password guessing on average. We also proposed a heuristic approach to selecting finetuning passwords based on JS (Jensen-Shannon) divergence and experimental results validated its usefulness. In summary, our contributions demonstrate the potential and feasibility of applying advanced NLP and ML methods to password modeling and cracking.
- Abstract(参考訳): テキストパスワードは依然として最も広く使われているユーザー認証メカニズムである。
テキストパスワードと自然言語の密接な関係のため、自然言語処理(NLP)と機械学習(ML)の高度な技術は、人間のパスワード生成行動の研究やより高度なパスワードクラッキング手法の開発など、さまざまな目的のためにパスワードをモデル化するために用いられる。
本稿では,NLPと深層学習(DL)で一般的な事前学習ファインタニングフレームワークに触発されたPassTSLを提案する。
本稿では,PassTSLの事前トレーニング設定の違いがPassTSLに与える影響を報告し,その効果を6つの大きなパスワードデータベースに適用した。
実験の結果、パスワードの推測において、SOTA(State-of-the-art)パスワードクラッキング法が最大で4.11%から64.69%の差で上回っていることがわかった。
PassTSLをベースとしたパスワード強度計(PSM)も実装し、ニューラルネットワークベースの手法とzxcvbnを併用することで、他の2つのSOTA PSMよりも安全性の低いエラー(パスワード強度を過大評価する)を発生させることができることを示した。
さらに,複数の微調整設定を検討した結果,事前訓練したデータの0.1%に留まらず,少量のトレーニングデータでも平均3%以上のパスワード推測の改善が期待できることがわかった。
また,JS(Jensen-Shannon)の発散に基づく微調整パスワードの選択に対するヒューリスティックなアプローチを提案し,その有用性を検証した。
要約すると、パスワードのモデリングとひび割れに高度なNLPおよびML手法を適用する可能性と可能性を示す。
関連論文リスト
- Unlocking Memorization in Large Language Models with Dynamic Soft Prompting [66.54460367290146]
大規模言語モデル(LLM)は、要約、質問応答、翻訳などの自然言語処理(NLP)タスクに革命をもたらした。
LLMはトレーニングデータを記憶する傾向があるため、重大なセキュリティリスクを生じ、プライバシー侵害や著作権侵害につながる可能性がある。
動的,プレフィックスに依存したソフトプロンプトを用いたLLM記憶推定手法を提案する。
論文 参考訳(メタデータ) (2024-09-20T18:56:32Z) - Nudging Users to Change Breached Passwords Using the Protection Motivation Theory [58.87688846800743]
我々は保護動機理論(PMT)に基づいて、侵入したパスワードの変更を促すナッジを設計する。
本研究は, PMTのセキュリティ研究への応用に寄与し, 漏洩したクレデンシャル通知を改善するための具体的な設計上の意味を提供する。
論文 参考訳(メタデータ) (2024-05-24T07:51:15Z) - Search-based Ordered Password Generation of Autoregressive Neural Networks [0.0]
GPTに基づくパスワード推測モデルであるSOPGesGPTを構築し,SOPGを用いてパスワードを生成する。
最も影響力のあるモデルであるOMEN、FLA、PassGAN、VAEPassと比較すると、SOPGesGPTは有効率とカバーレートの両方においてはるかに優れている。
論文 参考訳(メタデータ) (2024-03-15T01:30:38Z) - PassViz: A Visualisation System for Analysing Leaked Passwords [2.2530496464901106]
PassVizは、漏洩したパスワードを2次元空間で視覚化し分析するためのコマンドラインツールである。
本稿では、PassVizを用いて、漏洩したパスワードのさまざまな側面を視覚的に分析し、これまで知られていなかったパスワードパターンの発見を容易にする方法を示す。
論文 参考訳(メタデータ) (2023-09-22T16:06:26Z) - PassGPT: Password Modeling and (Guided) Generation with Large Language
Models [59.11160990637616]
パスワード生成のためのパスワードリークをトレーニングした大規模言語モデルであるPassGPTを提案する。
また、任意の制約を満たすパスワードを生成するために、PassGPTサンプリング手順を利用する誘導パスワード生成の概念も導入する。
論文 参考訳(メタデータ) (2023-06-02T13:49:53Z) - Targeted Honeyword Generation with Language Models [5.165256397719443]
ハニーワードは、パスワード違反を特定するためにデータベースに挿入された架空のパスワードである。
大きな問題は、実際のパスワードと区別が難しいハニーワードの作り方だ。
論文 参考訳(メタデータ) (2022-08-15T00:06:29Z) - LaMDA: Language Models for Dialog Applications [75.75051929981933]
LaMDAは、ダイアログに特化したトランスフォーマーベースのニューラルネットワークモデルのファミリーである。
注釈付きデータで微調整し、モデルが外部の知識ソースを参照できるようにすると、大幅な改善がもたらされる。
論文 参考訳(メタデータ) (2022-01-20T15:44:37Z) - Skeptic: Automatic, Justified and Privacy-Preserving Password Composition Policy Selection [44.040106718326605]
パスワード保護システムに強制するパスワード構成ポリシーの選択は、重要なセキュリティ上の決定である。
実際には、この選択は厳密で正当化できるものではなく、システム管理者は直感だけでパスワード構成ポリシーを選択する傾向にある。
本研究では,大量の実世界のパスワードデータから構築されたパスワード確率分布を推定する手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T22:12:13Z) - Interpretable Probabilistic Password Strength Meters via Deep Learning [13.97315111128149]
確率的パスワードメーターは、本質的にパスワード強度とパスワード構造との間に生じる潜伏関係を記述する能力を持っていることを示す。
既存の構造とは異なり、我々の方法はいかなる人間の偏見も無く、さらに重要なことに、そのフィードバックは確率論的解釈を持つ。
論文 参考訳(メタデータ) (2020-04-15T16:05:50Z) - Byte Pair Encoding is Suboptimal for Language Model Pretraining [49.30780227162387]
一グラムLMトークン化とバイトペア符号化(BPE)の違いを分析する。
その結果,一グラムのLMトークン化手法は,下流タスクと2つの言語でBPEと一致し,BPEより優れることがわかった。
我々は、将来の事前訓練されたLMの開発者が、より一般的なBPEよりもユニグラムのLMメソッドを採用することを期待する。
論文 参考訳(メタデータ) (2020-04-07T21:21:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。