Fugu-MT 論文翻訳(概要): Statistical Keystroke Synthesis for Improved Bot Detection

論文の概要: Statistical Keystroke Synthesis for Improved Bot Detection

arxiv url: http://arxiv.org/abs/2207.13394v2
Date: Thu, 28 Jul 2022 06:59:43 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-29 11:53:55.247395
Title: Statistical Keystroke Synthesis for Improved Bot Detection
Title（参考訳）: ボット検出のための統計的キーストローク合成
Authors: Daniel DeAlcala and Aythami Morales and Ruben Tolosana and Alejandro Acien and Julian Fierrez and Santiago Hernandez and Miguel A. Ferrer and Moises Diaz
Abstract要約: 本研究はキーストローク生体データ合成のための2つの統計的アプローチを提案する。実験には168,000人の被験者から1億3600万件のキーストロークイベントのデータセットが含まれている。その結果,提案手法により,リアルなヒト様合成キーストロークのサンプルを生成できることがわかった。
参考スコア（独自算出の注目度）: 63.447493500066045
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This work proposes two statistical approaches for the synthesis of keystroke biometric data based on Universal and User-dependent Models. Both approaches are validated on the bot detection task, using the keystroke synthetic data to better train the systems. Our experiments include a dataset with 136 million keystroke events from 168,000 subjects. We have analyzed the performance of the two synthesis approaches through qualitative and quantitative experiments. Different bot detectors are considered based on two supervised classifiers (Support Vector Machine and Long Short-Term Memory network) and a learning framework including human and generated samples. Our results prove that the proposed statistical approaches are able to generate realistic human-like synthetic keystroke samples. Also, the classification results suggest that in scenarios with large labeled data, these synthetic samples can be detected with high accuracy. However, in few-shot learning scenarios it represents an important challenge.
Abstract（参考訳）: 本研究は,ユニバーサルモデルとユーザ依存モデルに基づくキーストロークバイオメトリックデータの合成のための2つの統計的手法を提案する。どちらのアプローチもボット検出タスクで検証され、キーストローク合成データを使用してシステムをトレーニングする。実験には16万8000人の被験者から1億3600万件のキーストロークイベントのデータセットが含まれています。定性的および定量的な実験により,2つの合成手法の性能を解析した。異なるボット検出器は、2つの教師付き分類器(サポートベクターマシンと長期短期記憶ネットワーク)と、人間と生成されたサンプルを含む学習フレームワークに基づいて検討される。提案手法は,人間に似た合成キーストロークサンプルを生成できることを示す。また, 分類結果から, 大規模ラベルデータの場合, 合成試料を高精度に検出できることが示唆された。しかし、少数の学習シナリオでは、これは重要な課題である。

関連論文リスト

Multi-Class Human/Object Detection on Robot Manipulators using Proprioceptive Sensing [0.0]
本研究の目的は,3種類の人・物検出モデルを評価し,より詳細な接触解析を行うことである。データセットはFranka Emika Pandaロボットマニピュレータを用いて収集され、時系列分析のための前処理戦略を探索した。最高の性能モデルは、リアルタイムテスト中に91.11%の精度を達成し、マルチクラス検出モデルの実現可能性を示した。
論文参考訳（メタデータ） (2025-08-04T13:45:37Z)
Crucial-Diff: A Unified Diffusion Model for Crucial Image and Annotation Synthesis in Data-scarce Scenarios [36.938892077684635]
Crucial-Diffは重要なサンプルを合成するために設計されたドメインに依存しないフレームワークである。我々のフレームワークは多様な高品質なトレーニングデータを生成し、ピクセルレベルのAPは83.63%、F1-MAXは78.12%である。
論文参考訳（メタデータ） (2025-07-14T04:41:38Z)
Scaling Laws of Synthetic Data for Language Models [132.67350443447611]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文参考訳（メタデータ） (2025-03-25T11:07:12Z)
Flow-based Detection of Botnets through Bio-inspired Optimisation of Machine Learning [0.5735035463793009]
ボットネットは、ボットネット内の他のメンバーと自律的に感染し、伝播し、通信し、調整することができる。従来の検出手法は、様々なネットワークベースの検出回避手法に不適合になってきている。本研究では,ボットネットワーク活動のバイナリ分類を容易にするために,ネットワークフローに基づく行動モデルの適用について検討する。
論文参考訳（メタデータ） (2024-12-07T15:55:49Z)
Maximizing the Potential of Synthetic Data: Insights from Random Matrix Theory [8.713796223707398]
実データと合成データを混合して学習したバイナリ分類器の性能を,ランダム行列理論を用いて導出する。本研究は, 生成モデルの品質と検証戦略に焦点をあてて, 合成データにより性能が向上する条件を明らかにした。
論文参考訳（メタデータ） (2024-10-11T16:09:27Z)
Online Data Augmentation for Forecasting with Deep Learning [0.33554367023486936]
この研究は、ニューラルネットワークのトレーニング中に合成サンプルを生成するオンラインデータ拡張フレームワークを導入する。トレーニングプロセスを通じて、実データと合成データのバランスの取れた表現を維持します。オンラインデータ拡張はオフラインデータ拡張よりも予測性能が向上する、あるいは拡張アプローチがない、という実験結果が示唆されている。
論文参考訳（メタデータ） (2024-04-25T17:16:13Z)
Image change detection with only a few samples [7.5780621370948635]
画像変化検出タスクの最大の障害は、さまざまな場面をカバーする大きな注釈付きデータセットの欠如である。本稿では,合成データを生成するための単純な画像処理手法を提案する。次に、対象検出に基づく初期の融合ネットワークを設計し、シアムニューラルネットを上回ります。
論文参考訳（メタデータ） (2023-11-07T07:01:35Z)
Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。このようなモデルは大きい傾向があり、訓練データの総量を必要とする。人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文参考訳（メタデータ） (2023-11-02T01:51:43Z)
Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。 I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文参考訳（メタデータ） (2023-08-31T05:05:53Z)
Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文参考訳（メタデータ） (2023-06-09T18:40:55Z)
Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文参考訳（メタデータ） (2023-04-04T17:54:32Z)
Domain Generalization via Ensemble Stacking for Face Presentation Attack Detection [4.61143637299349]
顔提示攻撃検出(PAD)は、偽造攻撃に対する顔認識システムを保護する上で重要な役割を担っている。本研究では,合成データ生成と深層アンサンブル学習を組み合わせた包括的ソリューションを提案する。 4つのデータセットに対する実験結果は、3つのベンチマークデータセット上でのHTER(low half total error rate)を示す。
論文参考訳（メタデータ） (2023-01-05T16:44:36Z)
Synt++: Utilizing Imperfect Synthetic Data to Improve Speech Recognition [18.924716098922683]
合成データによる機械学習は、合成データと実際のデータ分布のギャップのため、簡単ではない。本稿では,分散ギャップに起因する問題を緩和するために,トレーニング中の2つの新しい手法を提案する。これらの手法は,合成データを用いた音声認識モデルの訓練を著しく改善することを示す。
論文参考訳（メタデータ） (2021-10-21T21:11:42Z)
Towards an Automatic Analysis of CHO-K1 Suspension Growth in Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文参考訳（メタデータ） (2020-10-20T08:36:51Z)
Evaluation of synthetic and experimental training data in supervised machine learning applied to charge state detection of quantum dots [0.0]
シミュレーションおよび実験データに基づいて学習した機械学習モデルの予測精度を評価する。分類器は、純粋に実験的なデータと、合成訓練データと実験訓練データの組み合わせの両方で最適であることがわかった。
論文参考訳（メタデータ） (2020-05-16T23:41:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。