論文の概要: Modelling Concurrency Bugs Using Machine Learning
- arxiv url: http://arxiv.org/abs/2305.05531v1
- Date: Mon, 8 May 2023 17:30:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-10 19:24:10.193952
- Title: Modelling Concurrency Bugs Using Machine Learning
- Title(参考訳): 機械学習を用いた並行バグのモデル化
- Authors: Teodor Rares Begu
- Abstract要約: このプロジェクトは、一般的な機械学習アプローチと最近の機械学習アプローチを比較することを目的としている。
我々は、実生活(同時)プログラムをシミュレートする範囲で生成する合成データセットを定義する。
各種機械学習モデルモデルの基本的な限界に関する仮説を定式化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Artificial Intelligence has gained a lot of traction in the recent years,
with machine learning notably starting to see more applications across a varied
range of fields. One specific machine learning application that is of interest
to us is that of software safety and security, especially in the context of
parallel programs. The issue of being able to detect concurrency bugs
automatically has intrigued programmers for a long time, as the added layer of
complexity makes concurrent programs more prone to failure. The development of
such automatic detection tools provides considerable benefits to programmers in
terms of saving time while debugging, as well as reducing the number of
unexpected bugs. We believe machine learning may help achieve this goal by
providing additional advantages over current approaches, in terms of both
overall tool accuracy as well as programming language flexibility. However, due
to the presence of numerous challenges specific to the machine learning
approach (correctly labelling a sufficiently large dataset, finding the best
model types/architectures and so forth), we have to approach each issue of
developing such a tool separately. Therefore, the focus of this project is on
comparing both common and recent machine learning approaches. We abstract away
the complexity of procuring a labelled dataset of concurrent programs under the
form of a synthetic dataset that we define and generate with the scope of
simulating real-life (concurrent) programs. We formulate hypotheses about
fundamental limits of various machine learning model types which we then
validate by running extensive tests on our synthetic dataset. We hope that our
findings provide more insight in the advantages and disadvantages of various
model types when modelling programs using machine learning, as well as any
other related field (e.g. NLP).
- Abstract(参考訳): 近年、人工知能は大きな注目を集めており、機械学習はさまざまな分野にまたがって、より多くのアプリケーションを見始めている。
私たちにとって興味深い機械学習アプリケーションのひとつは、特に並列プログラムのコンテキストにおいて、ソフトウェアの安全性とセキュリティに関するものです。
並行性バグを自動的に検出できるという問題は、複雑さの層が加わったことで、並列プログラムが障害に陥りやすいため、プログラマに長い間興味をそそられた。
このような自動検出ツールの開発は、デバッグ中の時間を節約し、予期しないバグの数を減らし、プログラマに多大な利益をもたらす。
機械学習は、ツールの正確性とプログラミング言語の柔軟性の両方の観点から、現在のアプローチに対するさらなるアドバンテージを提供することによって、この目標を達成することができると考えています。
しかし、機械学習アプローチに特有の多くの課題(十分に大きなデータセットを正しくラベル付けし、最適なモデルタイプやアーキテクチャを見つけるなど)があるため、そのようなツールを別々に開発する各問題にアプローチする必要があります。
したがって、このプロジェクトの焦点は、一般的な機械学習アプローチと最近の機械学習アプローチを比較することである。
我々は,実生活(同時)プログラムをシミュレートする範囲で生成する合成データセットという形で,並列プログラムのラベル付きデータセットの調達の複雑さを抽象化する。
さまざまな機械学習モデル型の基本的な限界に関する仮説を定式化し、合成データセットで広範なテストを実行して検証します。
機械学習を用いたプログラムをモデル化する際の様々なモデルタイプの利点とデメリット、および他の関連分野(NLPなど)についてより深い知見が得られることを期待している。
関連論文リスト
- HPC-Coder: Modeling Parallel Programs using Large Language Models [2.3101915391170573]
ハイパフォーマンスおよび科学的コードに特有のタスクに、いかに大きな言語モデルを適用することができるかを示す。
我々は、HPCと科学コードの新しいデータセットを導入し、それをいくつかの事前訓練されたモデルを微調整するために使用します。
本研究では,汎用モデルでは不可能なHPC関数を自動補完できることを示す。
論文 参考訳(メタデータ) (2023-06-29T19:44:55Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Machine Learning for QoS Prediction in Vehicular Communication:
Challenges and Solution Approaches [46.52224306624461]
最大スループット予測の強化,例えばストリーミングや高精細マッピングアプリケーションについて検討する。
収集したデータの基盤となる特性をよりよく理解することで、マシンラーニング技術上に信頼性を構築することができるかを強調します。
我々は、説明可能なAIを使用して、機械学習が明示的にプログラムされることなく、無線ネットワークの基本原理を学習できることを示す。
論文 参考訳(メタデータ) (2023-02-23T12:29:20Z) - HyperPUT: Generating Synthetic Faulty Programs to Challenge Bug-Finding
Tools [3.8520163964103835]
シードバグのあるプログラムを自動的に生成する補完的手法を提案する。
プログラム変換を漸進的に適用することで、"シード"バグからCプログラムを構築します。
論文 参考訳(メタデータ) (2022-09-14T13:09:41Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Design Automation for Fast, Lightweight, and Effective Deep Learning
Models: A Survey [53.258091735278875]
本調査では,エッジコンピューティングを対象としたディープラーニングモデルの設計自動化技術について述べる。
これは、有効性、軽量性、計算コストの観点からモデルの習熟度を定量化するために一般的に使用される主要なメトリクスの概要と比較を提供する。
この調査は、ディープモデル設計自動化技術の最先端の3つのカテゴリをカバーしている。
論文 参考訳(メタデータ) (2022-08-22T12:12:43Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Frugal Machine Learning [7.460473725109103]
本稿では,最小限の資源を用いて最も正確なモデルを構築することを目的としたフラジカルラーニングについて検討する。
最も有望なアルゴリズムは、スマートウォッチに実装して、時計自体のアクティビティ認識モデルを学ぶことによって、現実世界のシナリオで評価される。
論文 参考訳(メタデータ) (2021-11-05T21:27:55Z) - Importance measures derived from random forests: characterisation and
extension [0.2741266294612776]
この論文は、機械学習アルゴリズムの特定のファミリーによって構築されたモデルの解釈可能性を改善することを目的としている。
これらのモデルを解釈するためにいくつかのメカニズムが提案されており、この理論に沿ってそれらの理解を改善することを目指している。
論文 参考訳(メタデータ) (2021-06-17T13:23:57Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Knowledge as Invariance -- History and Perspectives of
Knowledge-augmented Machine Learning [69.99522650448213]
機械学習の研究は転換点にある。
研究の関心は、高度にパラメータ化されたモデルのパフォーマンス向上から、非常に具体的なタスクへとシフトしている。
このホワイトペーパーは、機械学習研究におけるこの新興分野の紹介と議論を提供する。
論文 参考訳(メタデータ) (2020-12-21T15:07:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。