論文の概要: A Simple and Agile Cloud Infrastructure to Support Cybersecurity
Oriented Machine Learning Workflows
- arxiv url: http://arxiv.org/abs/2002.11828v1
- Date: Wed, 26 Feb 2020 22:38:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 15:54:49.178651
- Title: A Simple and Agile Cloud Infrastructure to Support Cybersecurity
Oriented Machine Learning Workflows
- Title(参考訳): サイバーセキュリティ指向機械学習ワークフローをサポートするシンプルでアジャイルなクラウドインフラストラクチャ
- Authors: Konstantin Berlin and Ajay Lakshminarayanarao
- Abstract要約: 大きなデータボリューム、ラベル付けの複雑さ、絶え間ないコンセプトドリフトは、効果的なトレーニングデータセットを生成するのを難しくする。
ここでは、MLトレーニングとテストデータセットを生成するための、単純でレジリエントなクラウドインフラストラクチャについて説明する。
- 参考スコア(独自算出の注目度): 2.0610261400236802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating up to date, well labeled datasets for machine learning (ML)
security models is a unique engineering challenge, as large data volumes,
complexity of labeling, and constant concept drift makes it difficult to
generate effective training datasets. Here we describe a simple, resilient
cloud infrastructure for generating ML training and testing datasets, that has
enhanced the speed at which our team is able to research and keep in production
a multitude of security ML models.
- Abstract(参考訳): 機械学習(ML)のセキュリティモデルのためのよくラベル付けされたデータセットを生成することは、大規模なデータボリューム、ラベル付けの複雑さ、一定のコンセプトドリフトによって、効果的なトレーニングデータセットの生成が困難になるため、ユニークなエンジニアリング上の課題である。
ここでは、mlトレーニングとテストデータセットを生成するための、シンプルでレジリエントなクラウドインフラストラクチャについて説明します。
関連論文リスト
- An Augmented Surprise-guided Sequential Learning Framework for
Predicting the Melt Pool Geometry [4.021352247826289]
メタリック・アダプティブ・マニュファクチャリング(MAM)は、複雑な設計、最小限の廃棄物、迅速なプロトタイピング、素材の汎用性、カスタマイズされたソリューションなどの利点を提供する製造業を再構築した。
MAMの成功の重要な側面は、プロセスパラメータとメルトプール特性の関係を理解することである。
従来の機械学習(ML)メソッドは、有効ではあるが、複雑な関係をキャプチャするための大規模なデータセットに依存している。
本研究は,新たなサプライズ誘導型シーケンシャルラーニングフレームワークであるSurpriseAF-BOを導入し,MAMの大幅な変化を示唆するものである。
論文 参考訳(メタデータ) (2024-01-10T23:05:23Z) - Curated LLM: Synergy of LLMs and Data Curation for tabular augmentation
in ultra low-data regimes [62.94611066903098]
本稿では,Large Language Models (LLMs) の知識を低データ構造におけるデータ拡張に活用したCLLMを紹介する。
従来のジェネレータと比較して,低データ方式におけるCLLMの優れた性能を示す。
論文 参考訳(メタデータ) (2023-12-19T12:34:46Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - In Situ Framework for Coupling Simulation and Machine Learning with
Application to CFD [51.04126395480625]
近年、流体力学計算を容易にする機械学習(ML)の多くの成功例が報告されている。
シミュレーションが大きくなるにつれて、従来のオフライン学習のための新しいトレーニングデータセットの生成は、I/Oとストレージのボトルネックを生み出します。
この作業は、この結合を単純化し、異種クラスタでのその場トレーニングと推論を可能にするソリューションを提供する。
論文 参考訳(メタデータ) (2023-06-22T14:07:54Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - Federated Learning for Data Streams [12.856037831335994]
フェデレートラーニング(FL)は、IoTデバイスやスマートフォンが生成するデータ量の増加に対して、マシンラーニングモデルをトレーニングするための効果的なソリューションである。
フェデレートされた学習に関するこれまでの作業は、トレーニング開始前に収集された静的データセットでクライアントが動作することを前提としている。
本稿では,経験的リスク最小化によるデータストリームから学習する一般FLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-04T11:10:48Z) - Towards Robust Dataset Learning [90.2590325441068]
本稿では,頑健なデータセット学習問題を定式化するための三段階最適化法を提案する。
ロバストな特徴と非ロバストな特徴を特徴付ける抽象モデルの下で,提案手法はロバストなデータセットを確実に学習する。
論文 参考訳(メタデータ) (2022-11-19T17:06:10Z) - Closing the Loop: A Framework for Trustworthy Machine Learning in Power
Systems [0.0]
エネルギーセクターの深い脱炭には、再生可能エネルギー資源の大量侵入と膨大なグリッドアセット調整が必要である。
機械学習(ML)は、今後数十年で電力システムが変化していくにつれて、これらの課題を克服するのに役立つ。
物理シミュレーションデータから学習した信頼性の高いMLモデル構築に関わる5つの課題を概説する。
論文 参考訳(メタデータ) (2022-03-14T21:30:43Z) - Fix your Models by Fixing your Datasets [0.6058427379240697]
現在の機械学習ツールは、データ品質を改善するための合理化されたプロセスを欠いている。
そこで,本研究では,データセットにノイズや誤認のあるサンプルを見つけるための体系的枠組みを提案する。
2つのFortune 500企業のプライベートエンタープライズデータセットと同様に、当社のフレームワークの有効性を公開してみます。
論文 参考訳(メタデータ) (2021-12-15T02:41:50Z) - PyHard: a novel tool for generating hardness embeddings to support
data-centric analysis [0.38233569758620045]
PyHardは、複数のMLモデルの予測パフォーマンスに関連するデータセットの硬度埋め込みを生成する。
ユーザは、この埋め込みを複数の方法で操作することで、データとアルゴリズムのパフォーマンスに関する有用な洞察を得ることができる。
我々は、この分析が、MLモデルに挑戦するハードな観察のポケットの識別をどのように支援したかを示す。
論文 参考訳(メタデータ) (2021-09-29T14:08:26Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。