Fugu-MT 論文翻訳(概要): Do Automatic Comment Generation Techniques Fall Short? Exploring the Influence of Method Dependencies on Code Understanding

論文の概要: Do Automatic Comment Generation Techniques Fall Short? Exploring the Influence of Method Dependencies on Code Understanding

arxiv url: http://arxiv.org/abs/2504.19459v1
Date: Mon, 28 Apr 2025 03:49:06 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-02 19:15:54.307437
Title: Do Automatic Comment Generation Techniques Fall Short? Exploring the Influence of Method Dependencies on Code Understanding
Title（参考訳）: 自動コメント生成技術は短くなるか? コード理解におけるメソッド依存の影響を探る
Authors: Md Mustakim Billah, Md Shamimur Rahman, Banani Roy,
Abstract要約: メソッドレベルのコメントは、コードの理解を改善し、ソフトウェアのメンテナンスをサポートするために重要です。本研究は,ソフトウェアプロジェクトにおける依存メソッドの有病率と影響を調査し,メソッドレベルのコメント生成に対する依存性認識アプローチを提案する。本稿では,コメントの明確性,包括性,関連性を改善するためにヘルパーメソッド情報を含む新しい依存性認識手法であるHelpCOMを提案する。
参考スコア（独自算出の注目度）: 1.971759811837406
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Method-level comments are critical for improving code comprehension and supporting software maintenance. With advancements in large language models (LLMs), automated comment generation has become a major research focus. However, existing approaches often overlook method dependencies, where one method relies on or calls others, affecting comment quality and code understandability. This study investigates the prevalence and impact of dependent methods in software projects and introduces a dependency-aware approach for method-level comment generation. Analyzing a dataset of 10 popular Java GitHub projects, we found that dependent methods account for 69.25% of all methods and exhibit higher engagement and change proneness compared to independent methods. Across 448K dependent and 199K independent methods, we observed that state-of-the-art fine-tuned models (e.g., CodeT5+, CodeBERT) struggle to generate comprehensive comments for dependent methods, a trend also reflected in LLM-based approaches like ASAP. To address this, we propose HelpCOM, a novel dependency-aware technique that incorporates helper method information to improve comment clarity, comprehensiveness, and relevance. Experiments show that HelpCOM outperforms baseline methods by 5.6% to 50.4% across syntactic (e.g., BLEU), semantic (e.g., SentenceBERT), and LLM-based evaluation metrics. A survey of 156 software practitioners further confirms that HelpCOM significantly improves the comprehensibility of code involving dependent methods, highlighting its potential to enhance documentation, maintainability, and developer productivity in large-scale systems.
Abstract（参考訳）: メソッドレベルのコメントは、コードの理解を改善し、ソフトウェアのメンテナンスをサポートするために重要です。大規模言語モデル(LLM)の進歩により、自動コメント生成が研究の中心となっている。しかし、既存のアプローチは、あるメソッドが他のメソッドに依存したり呼び出したりするメソッド依存性を見落とし、コメントの品質とコードの理解に影響を与えます。本研究は,ソフトウェアプロジェクトにおける依存メソッドの有病率と影響を調査し,メソッドレベルのコメント生成に対する依存性認識アプローチを提案する。 10の人気のあるJava GitHubプロジェクトのデータセットを分析して、依存メソッドがすべてのメソッドの69.25%を占め、独立したメソッドよりも高いエンゲージメントと変更の傾向を示した。 448K 依存メソッドと 199K 依存メソッドにまたがって,最先端の微調整モデル (CodeT5+,CodeBERT など) が依存メソッドに対する包括的なコメントを生成するのに苦労していることが,ASAP のような LLM ベースのアプローチにも反映されている。そこで本研究では,コメントの明確性,包括性,関連性を改善するためにヘルパー手法情報を組み込んだ新しい依存性認識技術であるHelpCOMを提案する。実験の結果、HelpCOMはシンタクティック(例えばBLEU)、セマンティック(例えばSentenceBERT)、LCMベースの評価指標でベースラインメソッドを5.6%から50.4%上回ることがわかった。 156人のソフトウェア実践者の調査では、HelpCOMが依存性のあるメソッドを含むコードの理解性を著しく改善し、大規模システムにおけるドキュメント、保守性、開発者の生産性を向上する可能性を強調している。

関連論文リスト

evalSmarT: An LLM-Based Framework for Evaluating Smart Contract Generated Comments [0.0]
大規模な言語モデル(LLM)を評価対象として利用するモジュール型フレームワークである texttevalSmarT を提案する。コメント生成ツールのベンチマークや,最も情報に富んだアウトプットの選択において,その応用を実証する。
論文参考訳（メタデータ） (2025-07-28T12:37:43Z)
OpenUnlearning: Accelerating LLM Unlearning via Unified Benchmarking of Methods and Metrics [101.78963920333342]
我々は,大規模言語モデル(LLM)のアンラーニング手法とメトリクスをベンチマークするための標準フレームワークであるOpenUnlearningを紹介する。 OpenUnlearningは、9つのアンラーニングアルゴリズムと16のさまざまな評価を3つの主要なベンチマークで統合する。また、多様なアンラーニング手法をベンチマークし、広範囲な評価スイートとの比較分析を行う。
論文参考訳（メタデータ） (2025-06-14T20:16:37Z)
Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文参考訳（メタデータ） (2025-05-28T17:57:47Z)
Static Program Analysis Guided LLM Based Unit Test Generation [2.977347176343005]
大規模言語モデル(LLM)を用いたJavaメソッドの単体テスト生成を自動化する新しい手法について述べる。そこで本研究では,プログラム解析で得られたエンハンス・アンハンス・コンテクスト情報を用いた拡張プロンプトにより,LLMによる単体テストコード生成の有効性が向上することを示す。
論文参考訳（メタデータ） (2025-03-07T13:09:37Z)
Enhancing Input-Label Mapping in In-Context Learning with Contrastive Decoding [71.01099784480597]
大規模言語モデル(LLM)は、コンテキスト内学習(ICL)を通じて、様々なタスクで優れる In-Context Contrastive Decoding (ICCD)を導入する。 ICCDは、正と負のインコンテキストの例の出力分布を対比することで、入力ラベルマッピングを強調する。
論文参考訳（メタデータ） (2025-02-19T14:04:46Z)
A Controlled Study on Long Context Extension and Generalization in LLMs [85.4758128256142]
広義のテキスト理解とテキスト内学習は、完全な文書コンテキストを利用する言語モデルを必要とする。長期コンテキストモデルを直接訓練する際の実装上の課題のため、長期コンテキストを扱うためにモデルを拡張する多くの方法が提案されている。我々は,一貫したベースモデルと拡張データを利用して,標準化された評価による拡張メソッドの制御プロトコルを実装した。
論文参考訳（メタデータ） (2024-09-18T17:53:17Z)
Icing on the Cake: Automatic Code Summarization at Ericsson [4.145468342589189]
我々は,プロンプトの自動意味拡張(ASAP)という手法の性能評価を行った。静的なプログラム解析や情報検索,あるいは模範的な存在を必要としない4つの単純なアプローチのパフォーマンスを比較した。
論文参考訳（メタデータ） (2024-08-19T06:49:04Z)
Evaluating Saliency Explanations in NLP by Crowdsourcing [25.763227978763908]
クラウドソーシングによるNLPのサリエンシ評価手法を提案する。我々は,800名のクラウドワーカーを募集し,提案手法を用いて2つのデータセット上で7つのサリエンシ手法を実証的に評価した。本研究では,サリエンシ法の性能を解析し,既存の自動評価法と比較し,サリエンシ法を用いた場合のNLPとコンピュータビジョン(CV)フィールドの顕著な差異を明らかにした。
論文参考訳（メタデータ） (2024-05-17T13:27:45Z)
Comments as Natural Logic Pivots: Improve Code Generation via Comment Perspective [85.48043537327258]
本稿では, MANGO (comMents As Natural loGic pivOts) を提案する。その結果、MANGOは強いベースラインに基づいてコードパス率を大幅に改善することがわかった。論理的なコメントの復号化戦略の堅牢性は、考えの連鎖よりも顕著に高い。
論文参考訳（メタデータ） (2024-04-11T08:30:46Z)
Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.72940700598055]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文参考訳（メタデータ） (2024-03-04T16:21:54Z)
Generating Java Methods: An Empirical Assessment of Four AI-Based Code Assistants [5.32539007352208]
私たちは、人気のあるAIベースのコードアシスタントであるGitHub Copilot、Tabnine、ChatGPT、Google Bardの4つの有効性を評価します。その結果、Copilotは他のテクニックよりも正確であることが多いが、他のアプローチによって完全に仮定されるアシスタントは存在しないことが判明した。
論文参考訳（メタデータ） (2024-02-13T12:59:20Z)
Kun: Answer Polishment for Chinese Self-Alignment with Instruction Back-Translation [30.053409671898933]
Kunは、手動のアノテーションに頼ることなく、大きな言語モデル(LLM)のための高品質な命令チューニングデータセットを作成するための新しいアプローチである。我々は、Wudao、Wanjuan、SkyPileなど、さまざまな情報源から収集された不正なデータを活用して、100万以上の中国語の命令データポイントの実質的なデータセットを生成します。
論文参考訳（メタデータ） (2024-01-12T09:56:57Z)
Unity is Strength: Cross-Task Knowledge Distillation to Improve Code Review Generation [0.9208007322096533]
本稿では,クロスタスク知識蒸留に基づく新しいディープラーニングアーキテクチャであるdisCOREVを提案する。提案手法では,コメント生成モデルの微調整をコードリファインメントモデルで指導する。以上の結果から,本手法はBLEUスコアによって評価されたより良いレビューコメントを生成することが示された。
論文参考訳（メタデータ） (2023-09-06T21:10:33Z)
Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement [50.62461749446111]
Self-Polish(SP)は、与えられた問題を徐々に洗練し、より理解しやすく解けるように誘導することによって、モデルの推論を促進する新しい方法である。 SPは、CoTのような答え/推論サイドの他のすべてのプロンプトメソッドであり、最先端の技術とのシームレスな統合を可能にし、さらなる改善を可能にします。
論文参考訳（メタデータ） (2023-05-23T19:58:30Z)
FewNLU: Benchmarking State-of-the-Art Methods for Few-Shot Natural Language Understanding [89.92513889132825]
本稿では,従来の評価手順を,テスト性能,開発-テスト相関,安定性の3つの重要な側面で改善する評価フレームワークを提案する。評価フレームワークを実装したツールキットFewNLUと、最先端のメソッドをオープンソースとして公開しています。
論文参考訳（メタデータ） (2021-09-27T00:57:30Z)
Towards Improved and Interpretable Deep Metric Learning via Attentive Grouping [103.71992720794421]
グループ化は、様々な特徴の計算にディープ・メトリック・ラーニングでよく用いられてきた。本稿では,任意のメトリクス学習フレームワークと柔軟に統合可能な,改良された解釈可能なグループ化手法を提案する。
論文参考訳（メタデータ） (2020-11-17T19:08:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。