論文の概要: Precision in Practice: Knowledge Guided Code Summarizing Grounded in Industrial Expectations
- arxiv url: http://arxiv.org/abs/2602.03400v1
- Date: Tue, 03 Feb 2026 11:22:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.413891
- Title: Precision in Practice: Knowledge Guided Code Summarizing Grounded in Industrial Expectations
- Title(参考訳): 実践の精度: 産業的な期待を基礎とした知識指導型コード
- Authors: Jintai Li, Songqiang Chen, Shuo Jin, Xiaoyuan Xie,
- Abstract要約: 期待を意識したコード要約手法であるExpSumを提案する。
ExpSumをHarmonyOSプロジェクトで評価し,コード要約ベンチマークを広く使用した。
- 参考スコア(独自算出の注目度): 2.508240448634342
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code summaries are essential for helping developers understand code functionality and reducing maintenance and collaboration costs. Although recent advances in large language models (LLMs) have significantly improved automatic code summarization, the practical usefulness of generated summaries in industrial settings remains insufficiently explored. In collaboration with documentation experts from the industrial HarmonyOS project, we conducted a questionnaire study showing that over 57.4% of code summaries produced by state-of-the-art approaches were rejected due to violations of developers' expectations for industrial documentation. Beyond semantic similarity to reference summaries, developers emphasize additional requirements, including the use of appropriate domain terminology, explicit function categorization, and the avoidance of redundant implementation details. To address these expectations, we propose ExpSum, an expectation-aware code summarization approach that integrates function metadata abstraction, informative metadata filtering, context-aware domain knowledge retrieval, and constraint-driven prompting to guide LLMs in generating structured, expectation-aligned summaries. We evaluate ExpSum on the HarmonyOS project and widely used code summarization benchmarks. Experimental results show that ExpSum consistently outperforms all baselines, achieving improvements of up to 26.71% in BLEU-4 and 20.10% in ROUGE-L on HarmonyOS. Furthermore, LLM-based evaluations indicate that ExpSum-generated summaries better align with developer expectations across other projects, demonstrating its effectiveness for industrial code documentation.
- Abstract(参考訳): コード要約は、開発者がコード機能を理解し、メンテナンスとコラボレーションのコストを削減するのに不可欠である。
大規模言語モデル(LLM)の最近の進歩は、自動コード要約を著しく改善しているが、産業環境で生成された要約の実用的有用性はいまだ不十分である。
インダストリアル・ハーモニーOSプロジェクトのドキュメンテーションの専門家と共同で調査を行い、最先端のアプローチによるコードサマリーの57.4%以上が、インダストリアル・ドキュメンテーションに対する開発者の期待に反し、拒否されたことを示しました。
参照要約とのセマンティックな類似性以外にも、適切なドメイン用語の使用、明示的な関数の分類、冗長な実装の詳細の回避など、追加の要件を強調している。
これらの期待に応えるために,関数メタデータの抽象化,情報的メタデータフィルタリング,コンテキスト対応ドメイン知識検索,制約駆動型プロンプトを統合した期待対応コード要約手法であるExpSumを提案する。
ExpSumをHarmonyOSプロジェクトで評価し,コード要約ベンチマークを広く使用した。
実験の結果、ExpSumはすべてのベースラインを一貫して上回り、BLEU-4では26.71%、HarmonyOSではROUGE-Lでは20.10%の改善が達成された。
さらに、LCMベースの評価では、ExpSumの生成した要約は、他のプロジェクトにおける開発者の期待とよく一致しており、産業コードドキュメンテーションの有効性を示している。
関連論文リスト
- Progressive Code Integration for Abstractive Bug Report Summarization [0.32004175453646166]
本稿では,抽象バグレポート要約のためのプログレッシブコード統合フレームワークを提案する。
このアプローチでは、長いコードスニペットをテキストコンテンツと一緒にインクリメンタルに組み込んでいます。
我々のパイプラインは抽出ベースラインを7.5%-58.2%向上させ、最先端の抽象手法に匹敵する性能を達成する。
論文 参考訳(メタデータ) (2025-11-29T05:35:36Z) - What to Retrieve for Effective Retrieval-Augmented Code Generation? An Empirical Study and Beyond [32.467437657603604]
リポジトリレベルのコード生成は、複雑なコード依存と長いコンテキストの処理における大きな言語モデル(LLM)の制限のため、依然として困難である。
ユーザクエリを実装ステップに分解し,セマンティックな記述マッチングを通じてAPIを検索する,チェーン・オブ・シントを利用した新しいコンテキスト統合手法であるAllianceCoderを提案する。
CoderEvalとRepoExecに関する広範な実験を通じて、AllianceCoderは最先端のパフォーマンスを実現し、Pass@1を既存のアプローチよりも最大20%改善した。
論文 参考訳(メタデータ) (2025-03-26T14:41:38Z) - Code Summarization Beyond Function Level [0.213063058314067]
本研究では,関数レベルを超えたコード要約モデルの有効性について検討した。
微調整された最先端のCodeT5+ベースモデルは、コード要約に優れていた。
リポジトリレベルの要約は有望なポテンシャルを示したが、かなりの計算資源を必要とした。
論文 参考訳(メタデータ) (2025-02-23T20:31:21Z) - Intention is All You Need: Refining Your Code from Your Intention [19.827036493004435]
本稿では,従来のコメント・ツー・コード・プロセスを強化する意図に基づくコード改善手法を提案する。
提案手法は,意図抽出と意図誘導リビジョン生成という2つの重要な段階から構成される。
提案手法は,意図抽出において79%の精度を達成し,コードリファインメント生成において最大66%の精度を実現した。
論文 参考訳(メタデータ) (2025-02-12T07:26:13Z) - OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models [76.59316249991657]
コードのための大規模言語モデル(LLM)は、コード生成、推論タスク、エージェントシステムなど、さまざまな領域で必須になっている。
オープンアクセスのコード LLM はプロプライエタリなモデルの性能レベルに近づきつつあるが、高品質なコード LLM は依然として限られている。
トップクラスのコードLLMであるOpenCoderは、主要なモデルに匹敵するパフォーマンスを達成するだけでなく、研究コミュニティの"オープンクックブック"としても機能します。
論文 参考訳(メタデータ) (2024-11-07T17:47:25Z) - Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文 参考訳(メタデータ) (2024-10-02T09:11:10Z) - LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - REPOFUSE: Repository-Level Code Completion with Fused Dual Context [11.531678717514724]
本稿では,遅延トレードオフを伴わずにリポジトリレベルのコード補完を向上するための先駆的ソリューションであるREPOFUSEを紹介する。
本稿では、2種類の文脈を制限された大きさのプロンプトに効率的に凝縮する新しいランク・トランケート・ジェネレーション(RTG)手法を提案する。
REPOFUSEは既存のモデルよりも大幅に飛躍し、コード補完の正確な一致(EM)精度が40.90%から59.75%向上し、推論速度が26.8%向上した。
論文 参考訳(メタデータ) (2024-02-22T06:34:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。