Fugu-MT 論文翻訳(概要): Investigating the Impact of Vocabulary Difficulty and Code Naturalness on Program Comprehension

論文の概要: Investigating the Impact of Vocabulary Difficulty and Code Naturalness on Program Comprehension

arxiv url: http://arxiv.org/abs/2308.13429v1
Date: Fri, 25 Aug 2023 15:15:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-23 12:36:47.976684
Title: Investigating the Impact of Vocabulary Difficulty and Code Naturalness on Program Comprehension
Title（参考訳）: 語彙難易度とコード自然度がプログラム理解に及ぼす影響の検討
Authors: Bin Lin, Gregorio Robles
Abstract要約: 本研究の目的は,言語習得の観点から可読性と可読性を評価することである。我々は,それらの相関関係を理解するために統計的解析を行い,可読性および可読性予測法の性能向上にコード自然性および語彙難易度を用いることができるか分析する。
参考スコア（独自算出の注目度）: 3.35803394416914
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Context: Developers spend most of their time comprehending source code during software development. Automatically assessing how readable and understandable source code is can provide various benefits in different tasks, such as task triaging and code reviews. While several studies have proposed approaches to predict software readability and understandability, most of them only focus on local characteristics of source code. Besides, the performance of understandability prediction is far from satisfactory. Objective: In this study, we aim to assess readability and understandability from the perspective of language acquisition. More specifically, we would like to investigate whether code readability and understandability are correlated with the naturalness and vocabulary difficulty of source code. Method: To assess code naturalness, we adopted the cross-entropy metric, while we use a manually crafted list of code elements with their assigned advancement levels to assess the vocabulary difficulty. We will conduct a statistical analysis to understand their correlations and analyze whether code naturalness and vocabulary difficulty can be used to improve the performance of code readability and understandability prediction methods. The study will be conducted on existing datasets.
Abstract（参考訳）: コンテキスト: 開発者はほとんどの時間をソフトウェア開発でソースコードを理解するのに費やします。可読性と理解可能なソースコードの評価は、タスクのトリージングやコードレビューなど、さまざまなタスクでさまざまなメリットが期待できる。いくつかの研究がソフトウェア可読性と可理解性を予測するアプローチを提案しているが、そのほとんどはソースコードの局所的な特性にのみ焦点を当てている。さらに、可理解性予測のパフォーマンスは満足には程遠い。目的:本研究では,言語習得の観点から可読性と可読性を評価することを目的とする。より具体的には、コードの可読性と理解性がソースコードの自然性や語彙難易度と相関しているかどうかを検証したいと思います。方法: コード自然性を評価するために, 単語の難易度を評価するために, コード要素のリストを手作業で作成するのに対して, クロスエントロピーの指標を採用した。我々は,それらの相関関係を理解するために統計的解析を行い,コード可読性および可読性予測法の性能向上にコード自然性および語彙難易度を用いることができるか分析する。研究は既存のデータセットで実施する。

関連論文リスト

Readability-Robust Code Summarization via Meta Curriculum Learning [53.44612630063336]
現実の世界では、コードが貧弱な構造や難読化され、モデルのパフォーマンスが著しく低下することが多い。本稿では,可読性の低いコードに対するコード要約の堅牢性を向上する,新しい微調整手法であるRoFTCodeSumを提案する。
論文参考訳（メタデータ） (2026-01-09T02:38:24Z)
Towards a Science of Causal Interpretability in Deep Learning for Software Engineering [0.32634122554914]
ソフトウエアエンジニアリングのための深層学習(DL4SE)における因果解釈性を達成するための論文演説 Dissertationがニューラルネットワークモデル(NCM)の新しいポストホック解釈方法であるDoCodeを導入 DoCodeは因果推論を使用して、モデル予測のプログラミング言語指向の説明を提供する。
論文参考訳（メタデータ） (2025-05-21T02:13:11Z)
Is Compression Really Linear with Code Intelligence? [60.123628177110206]
textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文参考訳（メタデータ） (2025-05-16T16:59:14Z)
An Empirical Study on the Effectiveness of Large Language Models for Binary Code Understanding [50.17907898478795]
本研究では,現実のリバースエンジニアリングシナリオにおけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文参考訳（メタデータ） (2025-04-30T17:02:06Z)
NRevisit: A Cognitive Behavioral Metric for Code Understandability Assessment [1.513554688029813]
本稿では,動的コード理解可能性評価手法を提案する。コードを扱う特定のプログラマの観点から、パーソナライズされたコード理解可能性スコアを推定する。シンプルで低コストで非侵入型のデスクトップアイトラッカーや、標準のコンピュータカメラで簡単に実装できる。
論文参考訳（メタデータ） (2025-04-25T13:34:24Z)
On Explaining (Large) Language Models For Code Using Global Code-Based Explanations [45.126233498200534]
Language Models for Code (LLM4Code)は、ソフトウェア工学(SE)のランドスケープを大きく変えた。我々は、厳密な数学的基盤を持つ手法であるコード論理(Code$Q$)を導入し、個々のコード予測を説明できるトークンのサブセットを特定する。評価の結果、Code$Q$は意味のある入力概念(すなわち自然言語粒子)が出力生成にどのように影響するかを説明するための強力な解釈可能性法であることがわかった。
論文参考訳（メタデータ） (2025-03-21T01:00:45Z)
Readability Formulas, Systems and LLMs are Poor Predictors of Reading Ease [4.868319717279586]
我々は、視線追跡を用いたオンライン読解手段を用いて、読みやすさとリアルタイム読みやすさの基本的な側面に焦点を当てた。この評価を従来の可読性の公式、現代の機械学習システム、教育で使用される商用システムに適用すると、これらはすべて英語で読みやすいという予測が下手であることを示唆している。
論文参考訳（メタデータ） (2025-02-16T14:51:44Z)
Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文参考訳（メタデータ） (2024-10-29T12:21:23Z)
Is Functional Correctness Enough to Evaluate Code Language Models? Exploring Diversity of Generated Codes [17.95094238686012]
言語モデル(LM)は、自然言語の要求からコードを生成する素晴らしい能力を示した。我々は、LMが生成するコードの多様性を、コード生成能力を評価するための重要な基準として強調する。本稿では,コード間の類似性や機能的正しさを指標として,生成コードの多様性を評価するための体系的なアプローチを提案する。
論文参考訳（メタデータ） (2024-08-24T07:40:22Z)
When simplicity meets effectiveness: Detecting code comments coherence with word embeddings and LSTM [6.417777780911223]
コードコメントは、プログラマに実用的な情報を提供するため、ソフトウェア開発において重要な役割を果たす。開発者はコードを更新した後、コメントをそのまま残す傾向があり、2つのアーティファクトの間に相違が生じます。コードスニペットが与えられたら、そのコメントが一貫性があり、コードの背後にある意図をよく反映しているかどうかを特定することが重要です。
論文参考訳（メタデータ） (2024-05-25T15:21:27Z)
How Far Have We Gone in Binary Code Understanding Using Large Language Models [51.527805834378974]
バイナリコード理解におけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文参考訳（メタデータ） (2024-04-15T14:44:08Z)
Code Prompting Elicits Conditional Reasoning Abilities in Text+Code LLMs [65.2379940117181]
自然言語の問題をコードに変換する一連のプロンプトであるコードプロンプトを導入します。コードプロンプトは複数のLLMに対して高速に向上することがわかった。 GPT 3.5を解析した結果,入力問題のコードフォーマッティングが性能向上に不可欠であることが判明した。
論文参考訳（メタデータ） (2024-01-18T15:32:24Z)
Source Code Comprehension: A Contemporary Definition and Conceptual Model for Empirical Investigation [5.139874302398955]
研究コミュニティはソースコードの理解を概念として定義できていない。タスクによる暗黙的な定義が一般的であり、つまり、コード理解は実験的なタスクが測るものである。本稿では,ソースコードの理解を定義し,概念的枠組みを提示する参照作業を構成する。
論文参考訳（メタデータ） (2023-10-17T14:23:46Z)
Generating Summaries with Controllable Readability Levels [67.34087272813821]
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
論文参考訳（メタデータ） (2023-10-16T17:46:26Z)
Understanding Programs by Exploiting (Fuzzing) Test Cases [26.8259045248779]
プログラムのより深い意味理解を実現するために,入力と出力/振る舞いの関係を学習に取り入れることを提案する。コードの大部分の実行をトリガーするのに十分な入力を得るために,ファズテストを採用し,ファズチューニングを提案する。提案手法の有効性は,コードクローン検出とコード分類を含む2つのプログラム理解タスクにおいて検証され,最先端技術よりも大きなマージンで優れている。
論文参考訳（メタデータ） (2023-05-23T01:51:46Z)
Pre-Training Representations of Binary Code Using Contrastive Learning [13.570375923483452]
ContraBinは、ソースコードとコメント情報をバイナリと統合する、対照的な学習テクニックである。我々は、人書きと合成コメントがバイナリコード理解タスクに与える影響を分析する。
論文参考訳（メタデータ） (2022-10-11T02:39:06Z)
ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-03-15T08:25:08Z)
The Mind Is a Powerful Place: How Showing Code Comprehensibility Metrics Influences Code Understanding [10.644832702859484]
ソースコードの理解度を示す指標が,ソースコードの理解度を主観的に評価する上で,開発者を悩ませるかどうかを検討する。その結果、理解度測定値の表示値は、開発者のコード理解度評価に大きく、かつ大きなアンカー効果があることがわかった。
論文参考訳（メタデータ） (2020-12-16T14:27:45Z)
A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文参考訳（メタデータ） (2020-05-01T23:29:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。