論文の概要: End to End Software Engineering Research
- arxiv url: http://arxiv.org/abs/2112.11858v1
- Date: Wed, 22 Dec 2021 13:09:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 17:20:11.972904
- Title: End to End Software Engineering Research
- Title(参考訳): エンド・ツー・エンドのソフトウェア工学研究
- Authors: Idan Amit
- Abstract要約: エンドツーエンドの学習とは、機械学習が生のデータから始まり、必要な概念を予測し、すべてのステップが自動的に実行されることだ。
この目的のために構築された15kプロジェクトの5Mファイルのデータセットについて述べる。
- 参考スコア(独自算出の注目度): 1.2183405753834562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: End to end learning is machine learning starting in raw data and predicting a
desired concept, with all steps done automatically. In software engineering
context, we see it as starting from the source code and predicting process
metrics. This framework can be used for predicting defects, code quality,
productivity and more. End-to-end improves over features based machine learning
by not requiring domain experts and being able to extract new knowledge. We
describe a dataset of 5M files from 15k projects constructed for this goal. The
dataset is constructed in a way that enables not only predicting concepts but
also investigating their causes.
- Abstract(参考訳): エンドツーエンドの学習は、機械学習が生のデータから始まり、必要な概念を予測し、すべてのステップが自動的に実行される。
ソフトウェア工学の文脈では、ソースコードから始まり、プロセスのメトリクスを予測するものと捉えています。
このフレームワークは、欠陥、コード品質、生産性などの予測に使用することができる。
エンドツーエンドは、ドメインの専門家を必要とせず、新しい知識を抽出することで、機能ベースの機械学習を改善する。
この目的のために構築された15kプロジェクトの5Mファイルのデータセットについて述べる。
データセットは、概念の予測だけでなく、その原因の調査も可能にする方法で構築されている。
関連論文リスト
- RESTOR: Knowledge Recovery through Machine Unlearning [71.75834077528305]
Webスケールコーパスでトレーニングされた大規模な言語モデルは、望ましくないデータポイントを記憶することができる。
訓練されたモデルからこれらのデータポイントを「消去」することを目的とした、多くの機械学習手法が提案されている。
以下に示す次元に基づいて,機械学習のためのRESTORフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-31T20:54:35Z) - Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - Detecting Requirements Smells With Deep Learning: Experiences,
Challenges and Future Work [9.44316959798363]
本研究の目的は,手動でラベル付きデータセットを作成し,アンサンブル学習,深層学習(DL),単語埋め込みや伝達学習といった手法を用いて一般化問題を克服することで,従来の作業を改善することである。
現在の調査結果は、データセットが不均衡であり、どのクラスをもっと追加すべきかを示している。
論文 参考訳(メタデータ) (2021-08-06T12:45:15Z) - False perfection in machine prediction: Detecting and assessing
circularity problems in machine learning [11.878820609988695]
医療情報学や特許法などの重要な応用分野における機械学習の問題点を実証する。
入力データの表現に目的の出力が決定論的に定義されている測定値を含めると、完璧だが円形な予測が導かれる。
実世界のアプリケーションへの研究結果の転送には,データ表現から対象結果を定義する計測を分離することにより,円周性を回避する必要がある,と我々は主張する。
論文 参考訳(メタデータ) (2021-06-23T14:11:06Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - A Survey on Semi-parametric Machine Learning Technique for Time Series
Forecasting [4.9341230675162215]
Grey Machine Learning(GML)は、大きなデータセットと、可能性のある結果を予測する時系列用の小さなデータセットを扱うことができる。
本稿では,時系列予測のための半パラメトリック機械学習技術の概要を概観する。
論文 参考訳(メタデータ) (2021-04-02T03:26:20Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - Deep Data Flow Analysis [14.583644439728895]
ProGraMLは、ディープラーニングのためのプログラム全体のセマンティクスのポータブル表現である。
コンパイラ解析のための現在および将来の学習手法をベンチマークする。
本稿では, ProGraMLを用いて, ダウンストリームコンパイラ最適化タスクにおいて, 標準解析を学習し, 性能を向上できることを示す。
論文 参考訳(メタデータ) (2020-11-21T03:29:14Z) - Learning from similarity and information extraction from structured
documents [0.0]
目的は、巨大な実世界の文書データセット上で、単語ごとの分類のマイクロF1を改善することである。
結果は、提案されたアーキテクチャ部品がすべて、以前の結果を上回るために必要であることを確認した。
最高のモデルは、F1スコアの8.25利得によって、前の最先端結果を改善する。
論文 参考訳(メタデータ) (2020-10-17T21:34:52Z) - Learning Output Embeddings in Structured Prediction [73.99064151691597]
構造化予測に対する強力で柔軟なアプローチは、予測される構造化対象を潜在的に無限次元の特徴空間に埋め込むことである。
原空間における予測は、前像問題の解法により計算される。
本研究では,新しい特徴空間に出力埋め込みと回帰関数の有限近似を共同で学習することを提案する。
論文 参考訳(メタデータ) (2020-07-29T09:32:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。