論文の概要: Investigating the Impact of Vocabulary Difficulty and Code Naturalness
on Program Comprehension
- arxiv url: http://arxiv.org/abs/2308.13429v1
- Date: Fri, 25 Aug 2023 15:15:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 12:36:47.976684
- Title: Investigating the Impact of Vocabulary Difficulty and Code Naturalness
on Program Comprehension
- Title(参考訳): 語彙難易度とコード自然度がプログラム理解に及ぼす影響の検討
- Authors: Bin Lin, Gregorio Robles
- Abstract要約: 本研究の目的は,言語習得の観点から可読性と可読性を評価することである。
我々は,それらの相関関係を理解するために統計的解析を行い,可読性および可読性予測法の性能向上にコード自然性および語彙難易度を用いることができるか分析する。
- 参考スコア(独自算出の注目度): 3.35803394416914
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Context: Developers spend most of their time comprehending source code during
software development. Automatically assessing how readable and understandable
source code is can provide various benefits in different tasks, such as task
triaging and code reviews. While several studies have proposed approaches to
predict software readability and understandability, most of them only focus on
local characteristics of source code. Besides, the performance of
understandability prediction is far from satisfactory.
Objective: In this study, we aim to assess readability and understandability
from the perspective of language acquisition. More specifically, we would like
to investigate whether code readability and understandability are correlated
with the naturalness and vocabulary difficulty of source code.
Method: To assess code naturalness, we adopted the cross-entropy metric,
while we use a manually crafted list of code elements with their assigned
advancement levels to assess the vocabulary difficulty. We will conduct a
statistical analysis to understand their correlations and analyze whether code
naturalness and vocabulary difficulty can be used to improve the performance of
code readability and understandability prediction methods. The study will be
conducted on existing datasets.
- Abstract(参考訳): コンテキスト: 開発者はほとんどの時間をソフトウェア開発でソースコードを理解するのに費やします。
可読性と理解可能なソースコードの評価は、タスクのトリージングやコードレビューなど、さまざまなタスクでさまざまなメリットが期待できる。
いくつかの研究がソフトウェア可読性と可理解性を予測するアプローチを提案しているが、そのほとんどはソースコードの局所的な特性にのみ焦点を当てている。
さらに、可理解性予測のパフォーマンスは満足には程遠い。
目的:本研究では,言語習得の観点から可読性と可読性を評価することを目的とする。
より具体的には、コードの可読性と理解性がソースコードの自然性や語彙難易度と相関しているかどうかを検証したいと思います。
方法: コード自然性を評価するために, 単語の難易度を評価するために, コード要素のリストを手作業で作成するのに対して, クロスエントロピーの指標を採用した。
我々は,それらの相関関係を理解するために統計的解析を行い,コード可読性および可読性予測法の性能向上にコード自然性および語彙難易度を用いることができるか分析する。
研究は既存のデータセットで実施する。
関連論文リスト
- Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - Is Functional Correctness Enough to Evaluate Code Language Models? Exploring Diversity of Generated Codes [17.95094238686012]
言語モデル(LM)は、自然言語の要求からコードを生成する素晴らしい能力を示した。
我々は、LMが生成するコードの多様性を、コード生成能力を評価するための重要な基準として強調する。
本稿では,コード間の類似性や機能的正しさを指標として,生成コードの多様性を評価するための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-08-24T07:40:22Z) - When simplicity meets effectiveness: Detecting code comments coherence with word embeddings and LSTM [6.417777780911223]
コードコメントは、プログラマに実用的な情報を提供するため、ソフトウェア開発において重要な役割を果たす。
開発者はコードを更新した後、コメントをそのまま残す傾向があり、2つのアーティファクトの間に相違が生じます。
コードスニペットが与えられたら、そのコメントが一貫性があり、コードの背後にある意図をよく反映しているかどうかを特定することが重要です。
論文 参考訳(メタデータ) (2024-05-25T15:21:27Z) - How Far Have We Gone in Binary Code Understanding Using Large Language Models [51.527805834378974]
バイナリコード理解におけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。
評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文 参考訳(メタデータ) (2024-04-15T14:44:08Z) - Code Prompting Elicits Conditional Reasoning Abilities in Text+Code LLMs [65.2379940117181]
自然言語の問題をコードに変換する一連のプロンプトであるコードプロンプトを導入します。
コードプロンプトは複数のLLMに対して高速に向上することがわかった。
GPT 3.5を解析した結果,入力問題のコードフォーマッティングが性能向上に不可欠であることが判明した。
論文 参考訳(メタデータ) (2024-01-18T15:32:24Z) - Source Code Comprehension: A Contemporary Definition and Conceptual
Model for Empirical Investigation [5.139874302398955]
研究コミュニティはソースコードの理解を概念として定義できていない。
タスクによる暗黙的な定義が一般的であり、つまり、コード理解は実験的なタスクが測るものである。
本稿では,ソースコードの理解を定義し,概念的枠組みを提示する参照作業を構成する。
論文 参考訳(メタデータ) (2023-10-17T14:23:46Z) - Generating Summaries with Controllable Readability Levels [67.34087272813821]
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。
現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。
可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
論文 参考訳(メタデータ) (2023-10-16T17:46:26Z) - Understanding Programs by Exploiting (Fuzzing) Test Cases [26.8259045248779]
プログラムのより深い意味理解を実現するために,入力と出力/振る舞いの関係を学習に取り入れることを提案する。
コードの大部分の実行をトリガーするのに十分な入力を得るために,ファズテストを採用し,ファズチューニングを提案する。
提案手法の有効性は,コードクローン検出とコード分類を含む2つのプログラム理解タスクにおいて検証され,最先端技術よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2023-05-23T01:51:46Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - The Mind Is a Powerful Place: How Showing Code Comprehensibility Metrics
Influences Code Understanding [10.644832702859484]
ソースコードの理解度を示す指標が,ソースコードの理解度を主観的に評価する上で,開発者を悩ませるかどうかを検討する。
その結果、理解度測定値の表示値は、開発者のコード理解度評価に大きく、かつ大きなアンカー効果があることがわかった。
論文 参考訳(メタデータ) (2020-12-16T14:27:45Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。