論文の概要: End-to-End triplet loss based fine-tuning for network embedding in effective PII detection
- arxiv url: http://arxiv.org/abs/2502.09002v1
- Date: Thu, 13 Feb 2025 06:43:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:47:42.217876
- Title: End-to-End triplet loss based fine-tuning for network embedding in effective PII detection
- Title(参考訳): 実効PII検出におけるネットワーク埋め込みのためのエンド・ツー・エンド三重項損失に基づく微調整
- Authors: Rishika Kohli, Shaifu Gupta, Manoj Singh Gaur,
- Abstract要約: 本稿では,モバイルパケット中のPIIの露出を予測するための,ディープラーニングに基づくエンドツーエンド学習フレームワークを提案する。
このフレームワークは、トレーニング済みの大規模言語モデル(LLM)とオートエンコーダを使用して、ネットワークパケットの埋め込みを生成する。
提案する検出フレームワークと,ユーザのデバイスからPIIリークを検出する技術について比較した。
- 参考スコア(独自算出の注目度): 0.12289361708127873
- License:
- Abstract: There are many approaches in mobile data ecosystem that inspect network traffic generated by applications running on user's device to detect personal data exfiltration from the user's device. State-of-the-art methods rely on features extracted from HTTP requests and in this context, machine learning involves training classifiers on these features and making predictions using labelled packet traces. However, most of these methods include external feature selection before model training. Deep learning, on the other hand, typically does not require such techniques, as it can autonomously learn and identify patterns in the data without external feature extraction or selection algorithms. In this article, we propose a novel deep learning based end-to-end learning framework for prediction of exposure of personally identifiable information (PII) in mobile packets. The framework employs a pre-trained large language model (LLM) and an autoencoder to generate embedding of network packets and then uses a triplet-loss based fine-tuning method to train the model, increasing detection effectiveness using two real-world datasets. We compare our proposed detection framework with other state-of-the-art works in detecting PII leaks from user's device.
- Abstract(参考訳): モバイルデータエコシステムには、ユーザのデバイス上で実行されているアプリケーションによって生成されたネットワークトラフィックを検査し、ユーザのデバイスから個人データの流出を検出するための多くのアプローチがある。
最先端のメソッドはHTTPリクエストから抽出された機能に依存しており、このコンテキストでは、機械学習はこれらの機能の分類器を訓練し、ラベル付きパケットトレースを使用して予測する。
しかし、これらの手法の多くは、モデルトレーニングの前に外的特徴選択を含む。
一方ディープラーニングは、外部の特徴抽出や選択アルゴリズムを使わずに、データ内のパターンを自律的に学習し、識別することができるため、一般的にそのようなテクニックを必要としない。
本稿では,モバイルパケットにおける個人識別情報(PII)の露出を予測するための,新しいディープラーニングに基づくエンドツーエンド学習フレームワークを提案する。
このフレームワークは、トレーニング済みの大規模言語モデル(LLM)とオートエンコーダを使用して、ネットワークパケットの埋め込みを生成し、その後、トリプルトロスベースの微調整手法を使用してモデルをトレーニングし、2つの実世界のデータセットによる検出の有効性を高めている。
提案する検出フレームワークと,ユーザのデバイスからPIIリークを検出する技術について比較した。
関連論文リスト
- Effective Intrusion Detection for UAV Communications using Autoencoder-based Feature Extraction and Machine Learning Approach [2.3845721581271206]
本稿では,実際のデータセットを用いた自動エンコーダによるUAVの機械学習侵入検出手法を提案する。
実験の結果,提案手法は二分法および多クラス分類タスクのベースラインよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-10-01T08:44:23Z) - Preliminary study on artificial intelligence methods for cybersecurity threat detection in computer networks based on raw data packets [34.82692226532414]
本稿では,ネットワークトラフィック内の生パケットデータから直接リアルタイムに攻撃を検知できるディープラーニング手法について検討する。
コンピュータビジョンモデルを用いた処理に適した2次元画像表現を用いて,パケットをウィンドウに積み重ねて別々に認識する手法を提案する。
論文 参考訳(メタデータ) (2024-07-24T15:04:00Z) - IoTGeM: Generalizable Models for Behaviour-Based IoT Attack Detection [3.3772986620114387]
一般化性を重視したIoTネットワーク攻撃をモデル化するアプローチを提案する。
まず,機能抽出のための転がり窓のアプローチを改良し,オーバーフィッティングを低減した多段階機能選択プロセスを提案する。
次に、独立したトレインとテストデータセットを使用してモデルを構築し、テストする。
第3に、機械学習モデル、評価指標、データセットの多様なポートフォリオを使用して、方法論を厳格に評価する。
論文 参考訳(メタデータ) (2023-10-17T21:46:43Z) - Privacy Side Channels in Machine Learning Systems [87.53240071195168]
プライバシサイドチャネルは、システムレベルのコンポーネントを利用してプライベート情報を抽出する攻撃である。
例えば、差分プライベートなトレーニングを適用する前にトレーニングデータを重複させることで、保証可能なプライバシ保証を完全に無効にするサイドチャネルが生成されることを示す。
さらに,学習データセットに含まれる秘密鍵を抽出するために,言語モデルを学習データ再生からブロックするシステムを利用することを示す。
論文 参考訳(メタデータ) (2023-09-11T16:49:05Z) - Panning for gold: Lessons learned from the platform-agnostic automated
detection of political content in textual data [48.7576911714538]
異なるプラットフォーム間で政治的コンテンツを検出するために、これらの技術がどのように使用できるかについて議論する。
辞書,教師付き機械学習,ニューラルネットワークに依存する3つの検出手法のパフォーマンスを比較した。
この結果から,ニューラルネットワークと機械学習に基づくモデルによって達成されるノイズの少ないデータに対して,事前処理がモデル性能に与える影響が限定された。
論文 参考訳(メタデータ) (2022-07-01T15:23:23Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - SOME/IP Intrusion Detection using Deep Learning-based Sequential Models
in Automotive Ethernet Networks [2.3204135551124407]
侵入検知システムはサイバー攻撃を検出するために広く利用されている。
本稿では,SOME/IPプロトコル上でのオフライン侵入検出のための深層学習に基づくシーケンシャルモデルを提案する。
論文 参考訳(メタデータ) (2021-08-04T09:58:06Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。