論文の概要: GEML: A Grammar-based Evolutionary Machine Learning Approach for
Design-Pattern Detection
- arxiv url: http://arxiv.org/abs/2401.07042v1
- Date: Sat, 13 Jan 2024 11:05:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 20:08:33.085043
- Title: GEML: A Grammar-based Evolutionary Machine Learning Approach for
Design-Pattern Detection
- Title(参考訳): geml: 文法に基づく進化的機械学習によるデザインパターン検出
- Authors: Rafael Barbudo and Aurora Ram\'irez and Francisco Servant and Jos\'e
Ra\'ul Romero
- Abstract要約: デザインパターン(DP)はソフトウェア開発における良いプラクティスとして認識されています。
適切なドキュメントの欠如はトレーサビリティを損なうことが少なく、そのメリットは数千行のコードの間でぼやけています。
本稿では,多様な性質のソフトウェア特性を用いた進化的機械学習に基づく新しい検出手法であるGEMLを提案する。
- 参考スコア(独自算出の注目度): 7.018591019975254
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Design patterns (DPs) are recognised as a good practice in software
development. However, the lack of appropriate documentation often hampers
traceability, and their benefits are blurred among thousands of lines of code.
Automatic methods for DP detection have become relevant but are usually based
on the rigid analysis of either software metrics or specific properties of the
source code. We propose GEML, a novel detection approach based on evolutionary
machine learning using software properties of diverse nature. Firstly, GEML
makes use of an evolutionary algorithm to extract those characteristics that
better describe the DP, formulated in terms of human-readable rules, whose
syntax is conformant with a context-free grammar. Secondly, a rule-based
classifier is built to predict whether new code contains a hidden DP
implementation. GEML has been validated over five DPs taken from a public
repository recurrently adopted by machine learning studies. Then, we increase
this number up to 15 diverse DPs, showing its effectiveness and robustness in
terms of detection capability. An initial parameter study served to tune a
parameter setup whose performance guarantees the general applicability of this
approach without the need to adjust complex parameters to a specific pattern.
Finally, a demonstration tool is also provided.
- Abstract(参考訳): デザインパターン(DP)はソフトウェア開発における良いプラクティスとして認識されています。
しかし、適切なドキュメントの欠如がトレーサビリティを阻害することが多く、そのメリットは数千行のコードでぼやけている。
DP検出のための自動手法が重要になっているが、通常はソフトウェアメトリクスまたはソースコードの特定の特性の厳密な分析に基づいている。
本稿では,多様な性質のソフトウェア特性を用いた進化的機械学習に基づく新しい検出手法GEMLを提案する。
第一に、GEMLは進化的アルゴリズムを用いて、文脈自由文法に適合する構文を持つ可読性規則で定式化されたDPをよりよく記述する特徴を抽出する。
第二に、新しいコードが隠されたDP実装を含むかどうかを予測するためにルールベースの分類器が構築される。
GEMLは5つ以上のDPがパブリックリポジトリから取得され、機械学習研究によって再採用されている。
そして,この数値を15種類のDPまで増加させ,検出能力の面での有効性と堅牢性を示す。
最初のパラメータスタディでは、特定のパターンに複雑なパラメータを調整することなく、このアプローチの一般的な適用性を保証するパラメータ設定をチューニングした。
最後に、デモツールも提供される。
関連論文リスト
- Tractable Offline Learning of Regular Decision Processes [50.11277112628193]
この研究は、正則決定過程(RDP)と呼ばれる非マルコフ環境のクラスにおけるオフライン強化学習(RL)を研究する。
インスは、未来の観測と過去の相互作用からの報酬の未知の依存を実験的に捉えることができる。
多くのアルゴリズムは、まずこの未知の依存関係を自動学習技術を用いて再構築する。
論文 参考訳(メタデータ) (2024-09-04T14:26:58Z) - Graph-Structured Speculative Decoding [52.94367724136063]
投機的復号化は、大規模言語モデルの推論を加速する有望な手法として登場した。
本稿では, 有向非巡回グラフ(DAG)を応用して, 起案された仮説を管理する革新的な手法を提案する。
我々は1.73$times$から1.96$times$に顕著なスピードアップを観察し、標準投機的復号法を大幅に上回った。
論文 参考訳(メタデータ) (2024-07-23T06:21:24Z) - CodeIP: A Grammar-Guided Multi-Bit Watermark for Large Language Models of Code [56.019447113206006]
大規模言語モデル(LLM)はコード生成において顕著な進歩を遂げた。
CodeIPは、新しいマルチビット透かし技術で、出所の詳細を保存するために追加情報を埋め込む。
5つのプログラミング言語にまたがる実世界のデータセットで実施された実験は、CodeIPの有効性を実証している。
論文 参考訳(メタデータ) (2024-04-24T04:25:04Z) - Generalizable Embeddings with Cross-batch Metric Learning [10.553094246710865]
学習可能なプロトタイプの凸結合としてGAPを定式化する。
本稿では, 線形予測器をサンプルのバッチに適合させる反復過程として, プロトタイプ学習が表現可能であることを示す。
その観点で、各イテレーションで2つの不整合クラスを考え、他のバッチに適合するプロトタイプでバッチのサンプルを表現して学習を規則化する。
論文 参考訳(メタデータ) (2023-07-14T20:39:07Z) - DPMLBench: Holistic Evaluation of Differentially Private Machine
Learning [8.568872924668662]
近年,DP-SGDに基づくアルゴリズムの改良が提案されている。
さらに重要なのは、これらのDPMLアルゴリズムの改善を実用性、防御能力、一般化可能性で比較する包括的な研究が欠如していることだ。
このギャップを,画像分類タスクにおけるメンバーシップ推論攻撃(MIA)に対する実用性と防御能力に関する改良DPMLアルゴリズムの総合的な測定によって埋める。
論文 参考訳(メタデータ) (2023-05-10T05:08:36Z) - Coded Residual Transform for Generalizable Deep Metric Learning [34.100840501900706]
我々は,その一般化能力を大幅に向上させるために,深度学習のための符号化残差変換(CRT)と呼ばれる新しい手法を提案する。
CRTは、多彩なプロトタイプへのプロジェクションに基づいた補完的な視点のセットからフィーチャーマップを表現し、エンコードする。
実験結果とアブレーション実験により,提案手法は最先端の深層学習法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-09T06:17:31Z) - Automatic Clipping: Differentially Private Deep Learning Made Easier and
Stronger [39.93710312222771]
サンプルごとのクリッピングは、ディープラーニングモデルのための実用的な差分プライベート(DP)トレーニングを可能にするアルゴリズムの重要なステップである。
本稿では,任意のDPに対してRをチューニングする必要がなくなる自動クリッピング(automatic clipping)という,使い勝手の良い代替手法を提案する。
論文 参考訳(メタデータ) (2022-06-14T19:49:44Z) - What You See is What You Get: Distributional Generalization for
Algorithm Design in Deep Learning [12.215964287323876]
微分プライバシー(DP)と分布一般化(DG)の概念の関連性について検討・活用する。
我々は、標準勾配降下(SGD)の「病理」をバイパスするディープラーニング手法を設計するための新しい概念ツールを導入する。
論文 参考訳(メタデータ) (2022-04-07T05:41:40Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z) - Prototypical Contrastive Learning of Unsupervised Representations [171.3046900127166]
原型コントラスト学習(Prototypeal Contrastive Learning, PCL)は、教師なし表現学習法である。
PCLは暗黙的にデータのセマンティック構造を学習された埋め込み空間にエンコードする。
PCLは、複数のベンチマークで最先端のインスタンスワイド・コントラスト学習法より優れている。
論文 参考訳(メタデータ) (2020-05-11T09:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。