論文の概要: Improving Automated Code Reviews: Learning from Experience
- arxiv url: http://arxiv.org/abs/2402.03777v1
- Date: Tue, 6 Feb 2024 07:48:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 15:53:10.289188
- Title: Improving Automated Code Reviews: Learning from Experience
- Title(参考訳): コードレビューの自動化を改善する - 経験から学ぶ
- Authors: Hong Yi Lin, Patanamon Thongtanunam, Christoph Treude, Wachiraphan
Charoenwet
- Abstract要約: 本研究では,自動コードレビューモデルから高品質なレビューを生成できるかどうかを検討する。
経験を意識したオーバーサンプリングは、レビューの正確性、情報レベル、有意義性を高めることができる。
- 参考スコア(独自算出の注目度): 12.573740138977065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern code review is a critical quality assurance process that is widely
adopted in both industry and open source software environments. This process
can help newcomers learn from the feedback of experienced reviewers; however,
it often brings a large workload and stress to reviewers. To alleviate this
burden, the field of automated code reviews aims to automate the process,
teaching large language models to provide reviews on submitted code, just as a
human would. A recent approach pre-trained and fine-tuned the code intelligent
language model on a large-scale code review corpus. However, such techniques
did not fully utilise quality reviews amongst the training data. Indeed,
reviewers with a higher level of experience or familiarity with the code will
likely provide deeper insights than the others. In this study, we set out to
investigate whether higher-quality reviews can be generated from automated code
review models that are trained based on an experience-aware oversampling
technique. Through our quantitative and qualitative evaluation, we find that
experience-aware oversampling can increase the correctness, level of
information, and meaningfulness of reviews generated by the current
state-of-the-art model without introducing new data. The results suggest that a
vast amount of high-quality reviews are underutilised with current training
strategies. This work sheds light on resource-efficient ways to boost automated
code review models.
- Abstract(参考訳): 現代のコードレビューは、業界とオープンソースの両方で広く採用されている品質保証プロセスである。
このプロセスは、経験豊富なレビュアーからのフィードバックから初心者が学ぶのに役立つが、レビュアーには大きなワークロードとストレスをもたらすことが多い。
この負担を軽減するため、自動コードレビューの分野はプロセスを自動化することを目的としており、大きな言語モデルに人間のように、提出されたコードに対するレビューを提供するように教えている。
最近のアプローチでは、大規模なコードレビューコーパスで、コードインテリジェント言語モデルを事前学習し、微調整した。
しかし、これらの手法はトレーニングデータの品質評価を完全に活用することはなかった。
実際、コードに対する高いレベルの経験や慣れ親しんだレビュアーは、他のものよりも深い洞察を提供するでしょう。
本研究では,経験型オーバーサンプリング技術に基づいてトレーニングされた自動コードレビューモデルから,高品質なレビューを生成できるかどうかを検討する。
定量的および定性的な評価により,経験意識によるオーバーサンプリングは,新たなデータを導入することなく,現在の最先端モデルが生成するレビューの正確性,情報レベル,有意義性を向上できることがわかった。
その結果,現行のトレーニング戦略では,高品質なレビューが不十分であることが示唆された。
この作業は、自動コードレビューモデルを強化するためのリソース効率のよい方法に光を当てています。
関連論文リスト
- Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - Predicting Expert Evaluations in Software Code Reviews [8.012861163935904]
本稿では,その複雑さや主観性から回避されるコードレビューの側面を自動化するアルゴリズムモデルを提案する。
手作業によるレビューを置き換える代わりに、私たちのモデルは、レビュアーがより影響力のあるタスクに集中するのに役立つ洞察を追加します。
論文 参考訳(メタデータ) (2024-09-23T16:01:52Z) - Leveraging Reviewer Experience in Code Review Comment Generation [11.224317228559038]
私たちは、自然言語のコードレビューを提供する際に、人間のレビュアーを模倣するためにディープラーニングモデルを訓練します。
生成したレビューの品質は、モデルトレーニングで使用されるオープンソースのコードレビューデータの品質のため、まだ最適化されていない。
本稿では,レビュー品質の指標として,過去のレビュアのオーサリングとレビューを活かした経験学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-17T07:52:50Z) - AI-Assisted Assessment of Coding Practices in Modern Code Review [11.803776132972029]
AutoCommenterは、コーディングのベストプラクティスを学習し、強制するためのエンドツーエンドシステムである。
本稿では,AutoCommenterの開発,展開,評価について報告する。
論文 参考訳(メタデータ) (2024-05-22T11:57:18Z) - ReviewRanker: A Semi-Supervised Learning Based Approach for Code Review
Quality Estimation [0.6895577977557867]
レビュープロセスの有効性と継続的改善の検査は、開発生産性を高めることができる。
本稿では,各コードレビューに信頼性スコアを割り当てることを目的とした,半教師付き学習システムであるReviewRankerを提案する。
提案手法は,開発者が提供したシンプルで明確なラベルに基づいて訓練される。
論文 参考訳(メタデータ) (2023-07-08T15:37:48Z) - Tram: A Token-level Retrieval-augmented Mechanism for Source Code Summarization [76.57699934689468]
ニューラルモデルの性能を高めるために,デコーダ側で詳細なTokenレベル検索強化機構(Tram)を提案する。
文脈的コードセマンティクスの取得におけるトークンレベルの検索の課題を克服するために,コードセマンティクスを個々の要約トークンに統合することを提案する。
論文 参考訳(メタデータ) (2023-05-18T16:02:04Z) - CodeExp: Explanatory Code Document Generation [94.43677536210465]
既存のコード・トゥ・テキスト生成モデルは、コードの高レベルな要約のみを生成する。
我々は、コードのための高品質な説明記述の基準を特定するために、人間の研究を行う。
タスクのための多段階微調整戦略とベースラインモデルを提案する。
論文 参考訳(メタデータ) (2022-11-25T18:05:44Z) - CodeReviewer: Pre-Training for Automating Code Review Activities [36.40557768557425]
本研究は,コードレビューシナリオにおけるタスクの事前学習技術を活用することに焦点を当てる。
私たちは、最も人気のある9つのプログラミング言語で、オープンソースのプロジェクトから、現実世界のコード変更とコードレビューの大規模なデータセットを収集します。
コード差分とレビューをよりよく理解するために、コードレビューセナリオに特化した4つの事前トレーニングタスクを利用する事前トレーニングモデルであるCodeReviewerを提案する。
論文 参考訳(メタデータ) (2022-03-17T05:40:13Z) - ProtoTransformer: A Meta-Learning Approach to Providing Student Feedback [54.142719510638614]
本稿では,フィードバックを数発の分類として提供するという課題について考察する。
メタラーナーは、インストラクターによるいくつかの例から、新しいプログラミング質問に関する学生のコードにフィードバックを与えるように適応します。
本手法は,第1段階の大学が提供したプログラムコースにおいて,16,000名の学生試験ソリューションに対するフィードバックの提供に成功している。
論文 参考訳(メタデータ) (2021-07-23T22:41:28Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Unsupervised Opinion Summarization with Noising and Denoising [85.49169453434554]
ユーザレビューのコーパスから合成データセットを作成し、レビューをサンプリングし、要約のふりをして、ノイズのあるバージョンを生成します。
テスト時に、モデルは本物のレビューを受け入れ、健全な意見を含む要約を生成し、合意に達しないものをノイズとして扱います。
論文 参考訳(メタデータ) (2020-04-21T16:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。