論文の概要: A Survey on Machine Learning Techniques for Source Code Analysis
- arxiv url: http://arxiv.org/abs/2110.09610v1
- Date: Mon, 18 Oct 2021 20:13:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-21 03:01:00.242471
- Title: A Survey on Machine Learning Techniques for Source Code Analysis
- Title(参考訳): ソースコード解析のための機械学習技術に関する調査
- Authors: Tushar Sharma, Maria Kechagia, Stefanos Georgiou, Rohit Tiwari,
Federica Sarro
- Abstract要約: ソースコード解析に応用された機械学習の領域における現在の知識を要約することを目的としている。
そこで本研究では,2002年から2021年にかけて,広範囲にわたる文献検索を行い,初等研究364点を同定した。
- 参考スコア(独自算出の注目度): 14.129976741300029
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context: The advancements in machine learning techniques have encouraged
researchers to apply these techniques to a myriad of software engineering tasks
that use source code analysis such as testing and vulnerabilities detection. A
large number of studies poses challenges to the community to understand the
current landscape. Objective: We aim to summarize the current knowledge in the
area of applied machine learning for source code analysis. Method: We
investigate studies belonging to twelve categories of software engineering
tasks and corresponding machine learning techniques, tools, and datasets that
have been applied to solve them. To do so, we carried out an extensive
literature search and identified 364 primary studies published between 2002 and
2021. We summarize our observations and findings with the help of the
identified studies. Results: Our findings suggest that the usage of machine
learning techniques for source code analysis tasks is consistently increasing.
We synthesize commonly used steps and the overall workflow for each task, and
summarize the employed machine learning techniques. Additionally, we collate a
comprehensive list of available datasets and tools useable in this context.
Finally, we summarize the perceived challenges in this area that include
availability of standard datasets, reproducibility and replicability, and
hardware resources.
- Abstract(参考訳): コンテキスト: 機械学習技術の進歩は、テストや脆弱性検出などのソースコード分析を使用する無数のソフトウェアエンジニアリングタスクに、これらの技術を適用するように研究者に促した。
多くの研究が、現在の風景を理解するためにコミュニティに挑戦している。
目的: ソースコード解析のための応用機械学習の分野における現在の知識を要約すること。
方法: ソフトウェア工学タスクの12のカテゴリとそれに対応する機械学習技術,ツール,およびそれを解決するために適用されたデータセットについて検討する。
そこで本研究では,2002年から2021年にかけて,広範囲にわたる文献検索を行い,初等研究364点を同定した。
我々は,特定した研究の助けを借りて,観察と発見をまとめる。
結果: ソースコード解析タスクにおける機械学習技術の利用が一貫して増加していることが示唆された。
一般的に使用されるステップとタスク全体のワークフローを合成し、使用する機械学習技術を要約する。
さらに、このコンテキストで利用可能なデータセットとツールの包括的なリストを照合します。
最後に、標準データセットの可用性、再現性と複製性、ハードウェアリソースなど、この分野における認識された課題を要約する。
関連論文リスト
- Extraction of Research Objectives, Machine Learning Model Names, and Dataset Names from Academic Papers and Analysis of Their Interrelationships Using LLM and Network Analysis [0.0]
本研究では,研究論文からタスクや機械学習手法,データセット名を抽出する手法を提案する。
提案手法の表現抽出性能は,Llama3を用いた場合,様々なカテゴリでFスコアが0.8を超えている。
ファイナンシャルドメイン論文のベンチマーク結果は,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-08-22T03:10:52Z) - DISCOVER: A Data-driven Interactive System for Comprehensive Observation, Visualization, and ExploRation of Human Behaviour [6.716560115378451]
我々は,人間行動分析のための計算駆動型データ探索を効率化するために,モジュール型でフレキシブルでユーザフレンドリなソフトウェアフレームワークを導入する。
我々の主な目的は、高度な計算方法論へのアクセスを民主化することであり、これにより研究者は、広範囲の技術的熟練を必要とせずに、詳細な行動分析を行うことができる。
論文 参考訳(メタデータ) (2024-07-18T11:28:52Z) - Ontology Embedding: A Survey of Methods, Applications and Resources [54.3453925775069]
オントロジはドメイン知識とメタデータを表現するために広く使われている。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
埋め込みに関する多くの論文が出版されているが、体系的なレビューの欠如により、研究者はこの分野の包括的な理解を妨げている。
論文 参考訳(メタデータ) (2024-06-16T14:49:19Z) - Artificial intelligence to automate the systematic review of scientific
literature [0.0]
我々は過去15年間に提案されたAI技術について,研究者が科学的文献の体系的な分析を行うのを助けるために調査を行った。
現在サポートされているタスク、適用されるアルゴリズムの種類、34の初等研究で提案されているツールについて説明する。
論文 参考訳(メタデータ) (2024-01-13T19:12:49Z) - Exploring Automated Code Evaluation Systems and Resources for Code
Analysis: A Comprehensive Survey [1.024113475677323]
本研究では,自動コード評価システム(AES)の応用領域とその資源について検討する。
AESはプログラミングコンテスト、プログラミングの学習と教育、採用、オンラインコンパイラ、追加モジュールに分類される。
本稿では,システム設計(ハードウェアとソフトウェア),運用(競争と教育),研究の観点から,AESの実例として会津オンライン審査プラットフォームについて概説する。
論文 参考訳(メタデータ) (2023-07-08T16:31:38Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Active Multi-Task Representation Learning [50.13453053304159]
本研究は,アクティブラーニングの手法を活用することで,資源タスクのサンプリングに関する最初の公式な研究を行う。
提案手法は, 対象タスクに対する各ソースタスクの関連性を反復的に推定し, その関連性に基づいて各ソースタスクからサンプルを抽出するアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-02T08:23:24Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Curriculum Learning: A Survey [65.31516318260759]
カリキュラム学習戦略は、機械学習のあらゆる分野で成功している。
我々は,様々な分類基準を考慮して,カリキュラム学習アプローチの分類を手作業で構築する。
集約型クラスタリングアルゴリズムを用いて,カリキュラム学習手法の階層木を構築する。
論文 参考訳(メタデータ) (2021-01-25T20:08:32Z) - A Systematic Literature Review on the Use of Deep Learning in Software
Engineering Research [22.21817722054742]
ソフトウェア開発タスクを自動化するために、ソフトウェア工学(SE)研究者が採用するテクニックのセットが、ディープラーニング(DL)の概念に根ざしている。
本稿では,SE & DLの交差点における研究の体系的な文献レビューを行う。
我々は、機械学習技術の特定の問題領域への適用を規定する一連の原則である学習の構成要素を中心に分析を行う。
論文 参考訳(メタデータ) (2020-09-14T15:28:28Z) - Machine Learning for Software Engineering: A Systematic Mapping [73.30245214374027]
ソフトウェア開発業界は、現代のソフトウェアシステムを高度にインテリジェントで自己学習システムに移行するために、機械学習を急速に採用している。
ソフトウェアエンジニアリングライフサイクルの段階にわたって機械学習の採用について、現状を探求する包括的な研究は存在しない。
本研究は,機械学習によるソフトウェア工学(MLSE)分類を,ソフトウェア工学ライフサイクルのさまざまな段階に適用性に応じて,最先端の機械学習技術に分類するものである。
論文 参考訳(メタデータ) (2020-05-27T11:56:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。