Fugu-MT 論文翻訳(概要): A Simple and Agile Cloud Infrastructure to Support Cybersecurity Oriented Machine Learning Workflows

論文の概要: A Simple and Agile Cloud Infrastructure to Support Cybersecurity Oriented Machine Learning Workflows

arxiv url: http://arxiv.org/abs/2002.11828v1
Date: Wed, 26 Feb 2020 22:38:40 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-28 15:54:49.178651
Title: A Simple and Agile Cloud Infrastructure to Support Cybersecurity Oriented Machine Learning Workflows
Title（参考訳）: サイバーセキュリティ指向機械学習ワークフローをサポートするシンプルでアジャイルなクラウドインフラストラクチャ
Authors: Konstantin Berlin and Ajay Lakshminarayanarao
Abstract要約: 大きなデータボリューム、ラベル付けの複雑さ、絶え間ないコンセプトドリフトは、効果的なトレーニングデータセットを生成するのを難しくする。ここでは、MLトレーニングとテストデータセットを生成するための、単純でレジリエントなクラウドインフラストラクチャについて説明する。
参考スコア（独自算出の注目度）: 2.0610261400236802
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generating up to date, well labeled datasets for machine learning (ML) security models is a unique engineering challenge, as large data volumes, complexity of labeling, and constant concept drift makes it difficult to generate effective training datasets. Here we describe a simple, resilient cloud infrastructure for generating ML training and testing datasets, that has enhanced the speed at which our team is able to research and keep in production a multitude of security ML models.
Abstract（参考訳）: 機械学習(ML)のセキュリティモデルのためのよくラベル付けされたデータセットを生成することは、大規模なデータボリューム、ラベル付けの複雑さ、一定のコンセプトドリフトによって、効果的なトレーニングデータセットの生成が困難になるため、ユニークなエンジニアリング上の課題である。ここでは、mlトレーニングとテストデータセットを生成するための、シンプルでレジリエントなクラウドインフラストラクチャについて説明します。

関連論文リスト

yProv4ML: Effortless Provenance Tracking for Machine Learning Systems [0.0]
大規模言語モデル(LLM)への関心の急速な高まりは、開発が追求される透明性と厳密さの欠如を浮き彫りにした。本稿では,PROV-JSONフォーマットで機械学習プロセス中に生成した出典情報をキャプチャするフレームワークであるyProv4MLを提案する。
論文参考訳（メタデータ） (2025-07-01T14:59:52Z)
Physics-Learning AI Datamodel (PLAID) datasets: a collection of physics simulations for machine learning [0.15469999759898032]
PLAIDは物理シミュレーションのデータセットを表現および共有するためのフレームワークである。 PLAIDはシミュレーションデータを記述するための統一標準を定義する。 PLAID標準の下で,構造力学と計算流体力学を網羅した6つのデータセットをリリースする。
論文参考訳（メタデータ） (2025-05-05T18:59:17Z)
Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文参考訳（メタデータ） (2024-10-22T06:43:28Z)
NVLM: Open Frontier-Class Multimodal LLMs [64.00053046838225]
NVLM 1.0は、フロンティアクラスのマルチモーダル言語モデル(LLM)のファミリーであり、視覚言語タスクの最先端結果を実現する。トレーニング効率とマルチモーダル推論能力を両立させる新しいアーキテクチャを提案する。我々は、NVLM-1.0モデルのための生産級マルチモーダリティを開発し、視覚言語タスクに優れる。
論文参考訳（メタデータ） (2024-09-17T17:59:06Z)
How to integrate cloud service, data analytic and machine learning technique to reduce cyber risks associated with the modern cloud based infrastructure [0.0]
クラウド技術、機械学習、データ可視化技術を組み合わせることで、ハイブリッドエンタープライズネットワークは大量のデータを保持できる。従来のセキュリティ技術は、クラウドプラットフォームの急速なデータ爆発に対処できない。機械学習を利用したセキュリティソリューションとデータ可視化技術は、セキュリティ脅威の検出、データ漏洩、ソフトウェア脆弱性の自動検出において、重要な役割を担っている。
論文参考訳（メタデータ） (2024-05-19T16:10:03Z)
An Augmented Surprise-guided Sequential Learning Framework for Predicting the Melt Pool Geometry [4.021352247826289]
メタリック・アダプティブ・マニュファクチャリング(MAM)は、複雑な設計、最小限の廃棄物、迅速なプロトタイピング、素材の汎用性、カスタマイズされたソリューションなどの利点を提供する製造業を再構築した。 MAMの成功の重要な側面は、プロセスパラメータとメルトプール特性の関係を理解することである。従来の機械学習(ML)メソッドは、有効ではあるが、複雑な関係をキャプチャするための大規模なデータセットに依存している。本研究は,新たなサプライズ誘導型シーケンシャルラーニングフレームワークであるSurpriseAF-BOを導入し,MAMの大幅な変化を示唆するものである。
論文参考訳（メタデータ） (2024-01-10T23:05:23Z)
Curated LLM: Synergy of LLMs and Data Curation for tabular augmentation in low-data regimes [57.62036621319563]
本稿では,Large Language Models (LLMs) の知識を低データ構造におけるデータ拡張に活用したCLLMを紹介する。従来のジェネレータと比較して,低データ方式におけるCLLMの優れた性能を示す。
論文参考訳（メタデータ） (2023-12-19T12:34:46Z)
netFound: Foundation Model for Network Security [11.38388749887112]
本稿では,新しいトランスフォーマーベースネットワーク基盤モデルであるnetFoundを紹介する。我々は、事前学習のために、豊富なラベルのないネットワークテレメトリデータに自己教師付き学習技術を採用する。実運用環境では,netFoundが隠れたネットワークコンテキストを効果的にキャプチャすることを示す。
論文参考訳（メタデータ） (2023-10-25T22:04:57Z)
In Situ Framework for Coupling Simulation and Machine Learning with Application to CFD [51.04126395480625]
近年、流体力学計算を容易にする機械学習(ML)の多くの成功例が報告されている。シミュレーションが大きくなるにつれて、従来のオフライン学習のための新しいトレーニングデータセットの生成は、I/Oとストレージのボトルネックを生み出します。この作業は、この結合を単純化し、異種クラスタでのその場トレーニングと推論を可能にするソリューションを提供する。
論文参考訳（メタデータ） (2023-06-22T14:07:54Z)
Hindsight States: Blending Sim and Real Task Elements for Efficient Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文参考訳（メタデータ） (2023-03-03T21:55:04Z)
Federated Learning for Data Streams [12.856037831335994]
フェデレートラーニング(FL)は、IoTデバイスやスマートフォンが生成するデータ量の増加に対して、マシンラーニングモデルをトレーニングするための効果的なソリューションである。フェデレートされた学習に関するこれまでの作業は、トレーニング開始前に収集された静的データセットでクライアントが動作することを前提としている。本稿では,経験的リスク最小化によるデータストリームから学習する一般FLアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-01-04T11:10:48Z)
Towards Robust Dataset Learning [90.2590325441068]
本稿では,頑健なデータセット学習問題を定式化するための三段階最適化法を提案する。ロバストな特徴と非ロバストな特徴を特徴付ける抽象モデルの下で,提案手法はロバストなデータセットを確実に学習する。
論文参考訳（メタデータ） (2022-11-19T17:06:10Z)
Fix your Models by Fixing your Datasets [0.6058427379240697]
現在の機械学習ツールは、データ品質を改善するための合理化されたプロセスを欠いている。そこで,本研究では,データセットにノイズや誤認のあるサンプルを見つけるための体系的枠組みを提案する。 2つのFortune 500企業のプライベートエンタープライズデータセットと同様に、当社のフレームワークの有効性を公開してみます。
論文参考訳（メタデータ） (2021-12-15T02:41:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。