論文の概要: LinkFormer: Automatic Contextualised Link Recovery of Software Artifacts
in both Project-based and Transfer Learning Settings
- arxiv url: http://arxiv.org/abs/2211.00381v1
- Date: Tue, 1 Nov 2022 10:54:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 14:56:12.812151
- Title: LinkFormer: Automatic Contextualised Link Recovery of Software Artifacts
in both Project-based and Transfer Learning Settings
- Title(参考訳): linkformer: プロジェクトベースおよび転送学習環境におけるソフトウェアアーチファクトの自動コンテクスト化リンクリカバリ
- Authors: Maliheh Izadi, Pooya Rostami Mazrae, Tom Mens, Arie van Deursen
- Abstract要約: 関連アーティファクトの関連付けは、ソフトウェアプロジェクトの効果的なドキュメンテーションとメンテナンスのための一般的なプラクティスである。
このようなリンクの発見と復元を自動で行うために,いくつかのリンクリカバリ手法が提案された。
LinkFormerは、予測モデルの時間と一般化性の影響に対処する。
- 参考スコア(独自算出の注目度): 7.061740334417124
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Software artifacts often interact with each other throughout the software
development cycle. Associating related artifacts is a common practice for
effective documentation and maintenance of software projects. Conventionally,
to register the link between an issue report and its associated commit,
developers manually include the issue identifier in the message of the relevant
commit. Research has shown that developers tend to forget to connect said
artifacts manually, resulting in a loss of links. Hence, several link recovery
techniques were proposed to discover and revive such links automatically.
However, the literature mainly focuses on improving the prediction accuracy on
a randomly-split test set, while neglecting other important aspects of this
problem, including the effect of time and generalizability of the predictive
models. In this paper, we propose LinkFormer to address this problem from three
aspects; 1) Accuracy: To better utilize contextual information for prediction,
we employ the Transformer architecture and fine-tune multiple pre-trained
models on textual and metadata of issues and commits. 2) Data leakage: To
empirically assess the impact of time through the splitting policy, we train
and test our proposed model along with several existing approaches on both
randomly- and temporally split data. 3) Generalizability: To provide a generic
model that can perform well across different projects, we further fine-tune
LinkFormer in two transfer learning settings. We empirically show that
researchers should preserve the temporal flow of data when training
learning-based models to resemble the real-world setting. In addition,
LinkFormer significantly outperforms the state-of-the-art by large margins.
LinkFormer is also capable of extending the knowledge it learned to unseen
projects with little to no historical data.
- Abstract(参考訳): ソフトウェアアーティファクトは、ソフトウェア開発サイクルを通して相互に相互作用することが多い。
関連アーティファクトの関連付けは、ソフトウェアプロジェクトの効果的なドキュメンテーションとメンテナンスのための一般的なプラクティスである。
従来、発行レポートと関連するコミットのリンクを登録するには、開発者は関連するコミットのメッセージに発行識別子を手動で含める。
調査によれば、開発者はそのアーティファクトを手動で接続することを忘れがちで、結果としてリンクが失われる傾向がある。
そこで,このようなリンクを自動で発見・再生する手法が提案されている。
しかし,本論文は主にランダムに分散したテストセットにおける予測精度の向上に重点を置いており,予測モデルの時間的効果や一般化可能性など,この問題の他の重要な側面を無視している。
本稿では,3つの側面からこの問題に対処するLinkFormerを提案する。
1) 正確性: 予測に文脈情報をよりよく活用するために, 問題やコミットのテキストとメタデータに, トランスフォーマアーキテクチャと事前学習された複数のモデルを用いる。
2) データの漏洩: 分割ポリシーによる時間の影響を実証的に評価するために, ランダム分割データと時間分割データの両方に対する既存のアプローチとともに, 提案モデルを訓練し, テストする。
3) 一般化可能性: 異なるプロジェクト間でうまく機能する汎用モデルを提供するため、2つの移行学習設定でLinkFormerをさらに微調整する。
実世界の環境に類似した学習モデルのトレーニングにおいて,研究者はデータの時間的流れを保存すべきである。
さらにLinkFormerは、最先端を大きなマージンで大幅に上回る。
linkformerはまた、ほとんど履歴データなしで、未発見のプロジェクトに対して学んだ知識を拡張することもできる。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Ranking and Combining Latent Structured Predictive Scores without Labeled Data [2.5064967708371553]
本稿では,新しい教師なしアンサンブル学習モデル(SUEL)を提案する。
連続的な予測スコアを持つ予測器のセット間の依存関係を利用して、ラベル付きデータなしで予測器をランク付けし、それらをアンサンブルされたスコアに重み付けする。
提案手法の有効性は、シミュレーション研究とリスク遺伝子発見の現実的応用の両方を通じて厳密に評価されている。
論文 参考訳(メタデータ) (2024-08-14T20:14:42Z) - Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient [52.2669490431145]
PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
論文 参考訳(メタデータ) (2024-05-28T11:30:19Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Building Resilience to Out-of-Distribution Visual Data via Input
Optimization and Model Finetuning [13.804184845195296]
本稿では,特定の目標視モデルに対する入力データを最適化する前処理モデルを提案する。
自律走行車におけるセマンティックセグメンテーションの文脈におけるアウト・オブ・ディストリビューションシナリオについて検討する。
提案手法により, 微調整モデルに匹敵するデータの性能を実現できることを示す。
論文 参考訳(メタデータ) (2022-11-29T14:06:35Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Realistic Re-evaluation of Knowledge Graph Completion Methods: An
Experimental Study [0.0]
本論文は,埋め込みモデルの真の有効性を評価することを目的とした,最初の体系的研究である。
実験の結果、これらのモデルは以前よりもはるかに精度が低いことが分かりました。
論文 参考訳(メタデータ) (2020-03-18T01:18:09Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。